CoD, Hacia un Agente Médico Interpretable utilizando Cadena de Diagnóstico
CoD, Towards an Interpretable Medical Agent using Chain of Diagnosis
July 18, 2024
Autores: Junying Chen, Chi Gui, Anningzhe Gao, Ke Ji, Xidong Wang, Xiang Wan, Benyou Wang
cs.AI
Resumen
El campo del diagnóstico médico ha experimentado una transformación significativa con la llegada de grandes modelos de lenguaje (LLMs), sin embargo, los desafíos de interpretabilidad dentro de estos modelos siguen en gran medida sin abordarse. Este estudio presenta Chain-of-Diagnosis (CoD) para mejorar la interpretabilidad de diagnósticos médicos basados en LLM. CoD transforma el proceso diagnóstico en una cadena diagnóstica que refleja el proceso mental de un médico, proporcionando una vía de razonamiento transparente. Además, CoD produce la distribución de confianza de la enfermedad para garantizar transparencia en la toma de decisiones. Esta interpretabilidad hace que los diagnósticos del modelo sean controlables y ayuda a identificar síntomas críticos para la investigación a través de la reducción de entropía de las confianzas. Con CoD, desarrollamos DiagnosisGPT, capaz de diagnosticar 9604 enfermedades. Los resultados experimentales demuestran que DiagnosisGPT supera a otros LLMs en pruebas diagnósticas. Además, DiagnosisGPT proporciona interpretabilidad al tiempo que garantiza controlabilidad en el rigor diagnóstico.
English
The field of medical diagnosis has undergone a significant transformation
with the advent of large language models (LLMs), yet the challenges of
interpretability within these models remain largely unaddressed. This study
introduces Chain-of-Diagnosis (CoD) to enhance the interpretability of
LLM-based medical diagnostics. CoD transforms the diagnostic process into a
diagnostic chain that mirrors a physician's thought process, providing a
transparent reasoning pathway. Additionally, CoD outputs the disease confidence
distribution to ensure transparency in decision-making. This interpretability
makes model diagnostics controllable and aids in identifying critical symptoms
for inquiry through the entropy reduction of confidences. With CoD, we
developed DiagnosisGPT, capable of diagnosing 9604 diseases. Experimental
results demonstrate that DiagnosisGPT outperforms other LLMs on diagnostic
benchmarks. Moreover, DiagnosisGPT provides interpretability while ensuring
controllability in diagnostic rigor.Summary
AI-Generated Summary