CoD, Vers un agent médical interprétable utilisant une chaîne de diagnostic
CoD, Towards an Interpretable Medical Agent using Chain of Diagnosis
July 18, 2024
Auteurs: Junying Chen, Chi Gui, Anningzhe Gao, Ke Ji, Xidong Wang, Xiang Wan, Benyou Wang
cs.AI
Résumé
Le domaine du diagnostic médical a connu une transformation significative avec l'avènement des grands modèles de langage (LLM), mais les défis liés à l'interprétabilité de ces modèles restent largement non résolus. Cette étude introduit la Chaîne de Diagnostic (Chain-of-Diagnosis, CoD) pour améliorer l'interprétabilité des diagnostics médicaux basés sur les LLM. CoD transforme le processus diagnostique en une chaîne de diagnostic qui reflète le raisonnement d'un médecin, offrant ainsi un cheminement de pensée transparent. De plus, CoD produit une distribution de confiance des maladies pour garantir la transparence dans la prise de décision. Cette interprétabilité rend les diagnostics du modèle contrôlables et aide à identifier les symptômes critiques à explorer grâce à la réduction de l'entropie des confiances. Avec CoD, nous avons développé DiagnosisGPT, capable de diagnostiquer 9604 maladies. Les résultats expérimentaux montrent que DiagnosisGPT surpasse d'autres LLM sur les benchmarks de diagnostic. Par ailleurs, DiagnosisGPT offre une interprétabilité tout en assurant une contrôlabilité dans la rigueur diagnostique.
English
The field of medical diagnosis has undergone a significant transformation
with the advent of large language models (LLMs), yet the challenges of
interpretability within these models remain largely unaddressed. This study
introduces Chain-of-Diagnosis (CoD) to enhance the interpretability of
LLM-based medical diagnostics. CoD transforms the diagnostic process into a
diagnostic chain that mirrors a physician's thought process, providing a
transparent reasoning pathway. Additionally, CoD outputs the disease confidence
distribution to ensure transparency in decision-making. This interpretability
makes model diagnostics controllable and aids in identifying critical symptoms
for inquiry through the entropy reduction of confidences. With CoD, we
developed DiagnosisGPT, capable of diagnosing 9604 diseases. Experimental
results demonstrate that DiagnosisGPT outperforms other LLMs on diagnostic
benchmarks. Moreover, DiagnosisGPT provides interpretability while ensuring
controllability in diagnostic rigor.Summary
AI-Generated Summary