CoD, Verso un Agente Medico Interpretabile utilizzando la Catena di Diagnosi
CoD, Towards an Interpretable Medical Agent using Chain of Diagnosis
July 18, 2024
Autori: Junying Chen, Chi Gui, Anningzhe Gao, Ke Ji, Xidong Wang, Xiang Wan, Benyou Wang
cs.AI
Abstract
Il campo della diagnosi medica ha subito una significativa trasformazione con l'avvento dei grandi modelli linguistici (LLM), tuttavia le sfide legate all'interpretabilità di questi modelli rimangono in gran parte irrisolte. Questo studio introduce la Catena di Diagnosi (CoD) per migliorare l'interpretabilità delle diagnosi mediche basate su LLM. CoD trasforma il processo diagnostico in una catena diagnostica che riflette il processo di pensiero di un medico, fornendo un percorso di ragionamento trasparente. Inoltre, CoD produce la distribuzione della confidenza della malattia per garantire la trasparenza nel processo decisionale. Questa interpretabilità rende le diagnosi del modello controllabili e aiuta a identificare i sintomi critici da indagare attraverso la riduzione dell'entropia delle confidenze. Con CoD, abbiamo sviluppato DiagnosisGPT, in grado di diagnosticare 9604 malattie. I risultati sperimentali dimostrano che DiagnosisGPT supera altri LLM nei benchmark diagnostici. Inoltre, DiagnosisGPT fornisce interpretabilità garantendo al contempo la controllabilità del rigore diagnostico.
English
The field of medical diagnosis has undergone a significant transformation
with the advent of large language models (LLMs), yet the challenges of
interpretability within these models remain largely unaddressed. This study
introduces Chain-of-Diagnosis (CoD) to enhance the interpretability of
LLM-based medical diagnostics. CoD transforms the diagnostic process into a
diagnostic chain that mirrors a physician's thought process, providing a
transparent reasoning pathway. Additionally, CoD outputs the disease confidence
distribution to ensure transparency in decision-making. This interpretability
makes model diagnostics controllable and aids in identifying critical symptoms
for inquiry through the entropy reduction of confidences. With CoD, we
developed DiagnosisGPT, capable of diagnosing 9604 diseases. Experimental
results demonstrate that DiagnosisGPT outperforms other LLMs on diagnostic
benchmarks. Moreover, DiagnosisGPT provides interpretability while ensuring
controllability in diagnostic rigor.