Vers la superintelligence médicale?

Les dernières données de microsoft

juil. 18, 2025

👨‍⚕️ Salut les supers docteurs,

Cette semaine, on plonge dans une étude qui marque un tournant dans l’histoire de l’IA médicale : Sequential Diagnosis with Language Models (Microsoft AI, juin 2025).

💡 L’objectif ? Ne plus tester l’IA sur sa "culture médicale" comme dans HealthBench, mais sur sa capacité à raisonner comme un clinicien : poser des questions, ajuster ses hypothèses, choisir les bons examens, conclure au bon moment… et le tout, sans exploser les coûts.

🧪 Le protocole : une simulation clinique ultra-réaliste

304 cas cliniques complexes issus des Clinicopathological Conferences du New England Journal of Medicine.
Chaque cas commence avec une présentation succincte.
L’IA (ou le médecin) doit :
- poser des questions d’anamnèse ou d’examen,
- prescrire des examens,
- poser un diagnostic final.
Les réponses sont délivrées par un modèle Gatekeeper, qui agit comme un "dossier médical vivant" : il répond uniquement aux demandes précises.
Deux critères d’évaluation :
- Justesse clinique (note de 1 à 5 attribuée par un juge IA entraîné par des médecins),
- Coût cumulé (consultations + actes, selon la tarification CMS américaine).

🧠 L’IA en version orchestrée : MAI-DxO

Le vrai saut technologique vient de MAI-DxO, une IA structurée comme une équipe médicale virtuelle :

Dr Hypothesis : tient le raisonnement diagnostique et l’actualise en temps réel.
Dr Test-Chooser : sélectionne les examens les plus utiles.
Dr Challenger : joue l’avocat du diable.
Dr Stewardship : veille aux coûts et à la pertinence.
Dr Checklist : s’assure de la cohérence globale.

Un vrai raisonnement collaboratif... sans humains.

📊 Les résultats marquants

Diagnostic :
- Médecins : 19,9 % de diagnostics corrects.
- MAI-DxO : 79,9 %, et jusqu’à 85,5 % en version « ensemble ».
Coûts :
- Médecins : 2 963 $ par cas.
- MAI-DxO : 2 396 $ (avec bien meilleure performance).
Optimisation du raisonnement :
- Moins de biais d’ancrage.
- Meilleure sélection d’examens.
- Décision plus rationnelle… mais dénuée d’intuition.

⚠️ Limites et biais identifiés

Cas très complexes : surreprésentation de pathologies rares, pas de "cas bénins" — attention à l'extrapolation en MG.
Pas d’interaction humaine : pas de gestion de l’émotion, de l’incertitude relationnelle ou de la temporalité.
Médecins humains désarmés : ils ne pouvaient utiliser ni internet, ni base de données — conditions expérimentales défavorables.
Coût = modèle américain : pas directement transposable à nos cabinets.

🧭 Ce que ça change pour nous, médecins généralistes

🤖 L’IA peut désormais raisonner. Mieux que nous ? Parfois. Mais soigner, ce n’est pas seulement raisonner.

Voici les 3 leviers à cultiver :

Se former à l’IA : comprendre ses usages, ses biais, ses limites, pour mieux en faire un partenaire.
Investir dans l’humain : alliance thérapeutique, écoute, soin intégratif, personnalisation.
Inventer une pratique augmentée : l’IA comme soutien à notre expertise, pas comme substitut.

🧩 En conclusion :

L’IA est en train de franchir la porte du raisonnement médical. À nous de décider si elle nous remplace... ou si elle nous élève.

Continuez à chercher, à apprendre, et à rester libre.

👉 Matthieu

Discussion à propos de ce post

Tout à fait prêt. Qu'avez-vous pour moi ?