Exploration de la relation enquête-diagnostic avec des simulateurs avancés de patients.
Exploring the Inquiry-Diagnosis Relationship with Advanced Patient Simulators
January 16, 2025
Auteurs: Zhaocheng Liu, Quan Tu, Wen Ye, Yu Xiao, Zhishou Zhang, Hengfu Cui, Yalun Zhu, Qiang Ju, Shizheng Li, Jian Xie
cs.AI
Résumé
La consultation médicale en ligne (CML) restreint les médecins à recueillir des informations sur les patients uniquement par des questions, rendant le processus de prise de décision diagnostique déjà complexe encore plus difficile. Récemment, les progrès rapides des grands modèles de langage ont démontré un potentiel significatif pour transformer la CML. Cependant, la plupart des études se sont principalement concentrées sur l'amélioration de la précision diagnostique dans des conditions d'informations relativement suffisantes, tout en accordant peu d'attention à la phase "d'interrogatoire" du processus de consultation. Ce manque de focalisation a laissé la relation entre "interrogatoire" et "diagnostic" insuffisamment explorée. Dans cet article, nous extrayons d'abord des stratégies d'interaction réelles de patients à partir de conversations authentiques médecin-patient et utilisons ces stratégies pour guider la formation d'un simulateur de patient reproduisant étroitement le comportement réel. En introduisant des dossiers médicaux dans notre simulateur de patient pour simuler les réponses des patients, nous menons des expériences approfondies pour explorer la relation entre "interrogatoire" et "diagnostic" dans le processus de consultation. Les résultats expérimentaux montrent que l'interrogatoire et le diagnostic suivent la loi de Liebig : une mauvaise qualité d'interrogatoire limite l'efficacité du diagnostic, indépendamment de la capacité diagnostique, et vice versa. De plus, les expériences révèlent des différences significatives dans la performance d'interrogatoire des différents modèles. Pour étudier ce phénomène, nous catégorisons le processus d'interrogatoire en quatre types : (1) interrogatoire sur les plaintes principales ; (2) spécification des symptômes connus ; (3) interrogatoire sur les symptômes accompagnants ; et (4) recueil des antécédents familiaux ou médicaux. Nous analysons la répartition des interrogatoires à travers les quatre types pour différents modèles afin d'explorer les raisons derrière leurs différences de performance significatives. Nous prévoyons de rendre open-source les poids et le code associé de notre simulateur de patient sur https://github.com/LIO-H-ZEN/PatientSimulator.
English
Online medical consultation (OMC) restricts doctors to gathering patient
information solely through inquiries, making the already complex sequential
decision-making process of diagnosis even more challenging. Recently, the rapid
advancement of large language models has demonstrated a significant potential
to transform OMC. However, most studies have primarily focused on improving
diagnostic accuracy under conditions of relatively sufficient information,
while paying limited attention to the "inquiry" phase of the consultation
process. This lack of focus has left the relationship between "inquiry" and
"diagnosis" insufficiently explored. In this paper, we first extract real
patient interaction strategies from authentic doctor-patient conversations and
use these strategies to guide the training of a patient simulator that closely
mirrors real-world behavior. By inputting medical records into our patient
simulator to simulate patient responses, we conduct extensive experiments to
explore the relationship between "inquiry" and "diagnosis" in the consultation
process. Experimental results demonstrate that inquiry and diagnosis adhere to
the Liebig's law: poor inquiry quality limits the effectiveness of diagnosis,
regardless of diagnostic capability, and vice versa. Furthermore, the
experiments reveal significant differences in the inquiry performance of
various models. To investigate this phenomenon, we categorize the inquiry
process into four types: (1) chief complaint inquiry; (2) specification of
known symptoms; (3) inquiry about accompanying symptoms; and (4) gathering
family or medical history. We analyze the distribution of inquiries across the
four types for different models to explore the reasons behind their significant
performance differences. We plan to open-source the weights and related code of
our patient simulator at https://github.com/LIO-H-ZEN/PatientSimulator.Summary
AI-Generated Summary