CoD, к созданию интерпретируемого медицинского агента с использованием цепочки диагностики
CoD, Towards an Interpretable Medical Agent using Chain of Diagnosis
July 18, 2024
Авторы: Junying Chen, Chi Gui, Anningzhe Gao, Ke Ji, Xidong Wang, Xiang Wan, Benyou Wang
cs.AI
Аннотация
Область медицинской диагностики претерпела значительные изменения с появлением больших языковых моделей (LLM), однако проблемы интерпретируемости в этих моделях остаются в значительной степени нерешенными. В данном исследовании представлена цепочка диагностики (CoD) для улучшения интерпретируемости медицинской диагностики на основе LLM. CoD преобразует процесс диагностики в цепочку диагностики, отражающую мыслительный процесс врача и предоставляющую прозрачный путь рассуждений. Кроме того, CoD выдает распределение уверенности в заболевании для обеспечения прозрачности в принятии решений. Эта интерпретируемость делает диагностику модели управляемой и помогает выявить критические симптомы для исследования путем уменьшения энтропии уверенностей. С помощью CoD мы разработали DiagnosisGPT, способный диагностировать 9604 заболевания. Экспериментальные результаты показывают, что DiagnosisGPT превосходит другие LLM на диагностических испытаниях. Более того, DiagnosisGPT обеспечивает интерпретируемость, обеспечивая при этом управляемость в диагностической строгости.
English
The field of medical diagnosis has undergone a significant transformation
with the advent of large language models (LLMs), yet the challenges of
interpretability within these models remain largely unaddressed. This study
introduces Chain-of-Diagnosis (CoD) to enhance the interpretability of
LLM-based medical diagnostics. CoD transforms the diagnostic process into a
diagnostic chain that mirrors a physician's thought process, providing a
transparent reasoning pathway. Additionally, CoD outputs the disease confidence
distribution to ensure transparency in decision-making. This interpretability
makes model diagnostics controllable and aids in identifying critical symptoms
for inquiry through the entropy reduction of confidences. With CoD, we
developed DiagnosisGPT, capable of diagnosing 9604 diseases. Experimental
results demonstrate that DiagnosisGPT outperforms other LLMs on diagnostic
benchmarks. Moreover, DiagnosisGPT provides interpretability while ensuring
controllability in diagnostic rigor.Summary
AI-Generated Summary