Vers la superintelligence médicale?
Les dernières données de microsoft
👨⚕️ Salut les supers docteurs,
Cette semaine, on plonge dans une étude qui marque un tournant dans l’histoire de l’IA médicale : Sequential Diagnosis with Language Models (Microsoft AI, juin 2025).
💡 L’objectif ? Ne plus tester l’IA sur sa "culture médicale" comme dans HealthBench, mais sur sa capacité à raisonner comme un clinicien : poser des questions, ajuster ses hypothèses, choisir les bons examens, conclure au bon moment… et le tout, sans exploser les coûts.
🧪 Le protocole : une simulation clinique ultra-réaliste
304 cas cliniques complexes issus des Clinicopathological Conferences du New England Journal of Medicine.
Chaque cas commence avec une présentation succincte.
L’IA (ou le médecin) doit :
poser des questions d’anamnèse ou d’examen,
prescrire des examens,
poser un diagnostic final.
Les réponses sont délivrées par un modèle Gatekeeper, qui agit comme un "dossier médical vivant" : il répond uniquement aux demandes précises.
Deux critères d’évaluation :
Justesse clinique (note de 1 à 5 attribuée par un juge IA entraîné par des médecins),
Coût cumulé (consultations + actes, selon la tarification CMS américaine).
🧠 L’IA en version orchestrée : MAI-DxO
Le vrai saut technologique vient de MAI-DxO, une IA structurée comme une équipe médicale virtuelle :
Dr Hypothesis : tient le raisonnement diagnostique et l’actualise en temps réel.
Dr Test-Chooser : sélectionne les examens les plus utiles.
Dr Challenger : joue l’avocat du diable.
Dr Stewardship : veille aux coûts et à la pertinence.
Dr Checklist : s’assure de la cohérence globale.
Un vrai raisonnement collaboratif... sans humains.
📊 Les résultats marquants
Diagnostic :
Médecins : 19,9 % de diagnostics corrects.
MAI-DxO : 79,9 %, et jusqu’à 85,5 % en version « ensemble ».
Coûts :
Médecins : 2 963 $ par cas.
MAI-DxO : 2 396 $ (avec bien meilleure performance).
Optimisation du raisonnement :
Moins de biais d’ancrage.
Meilleure sélection d’examens.
Décision plus rationnelle… mais dénuée d’intuition.
⚠️ Limites et biais identifiés
Cas très complexes : surreprésentation de pathologies rares, pas de "cas bénins" — attention à l'extrapolation en MG.
Pas d’interaction humaine : pas de gestion de l’émotion, de l’incertitude relationnelle ou de la temporalité.
Médecins humains désarmés : ils ne pouvaient utiliser ni internet, ni base de données — conditions expérimentales défavorables.
Coût = modèle américain : pas directement transposable à nos cabinets.
🧭 Ce que ça change pour nous, médecins généralistes
🤖 L’IA peut désormais raisonner. Mieux que nous ? Parfois. Mais soigner, ce n’est pas seulement raisonner.
Voici les 3 leviers à cultiver :
Se former à l’IA : comprendre ses usages, ses biais, ses limites, pour mieux en faire un partenaire.
Investir dans l’humain : alliance thérapeutique, écoute, soin intégratif, personnalisation.
Inventer une pratique augmentée : l’IA comme soutien à notre expertise, pas comme substitut.
🧩 En conclusion :
L’IA est en train de franchir la porte du raisonnement médical. À nous de décider si elle nous remplace... ou si elle nous élève.
Continuez à chercher, à apprendre, et à rester libre.
👉 Matthieu

