ChatPaper.aiChatPaper

PatientSim: 医師と患者のリアルな相互作用のためのペルソナ駆動型シミュレータ

PatientSim: A Persona-Driven Simulator for Realistic Doctor-Patient Interactions

May 23, 2025
著者: Daeun Kyung, Hyunseung Chung, Seongsu Bae, Jiho Kim, Jae Ho Sohn, Taerim Kim, Soo Kyung Kim, Edward Choi
cs.AI

要旨

医師と患者の診察では、多様な患者像に合わせた、文脈を理解した多段階のコミュニケーションが求められます。このような場面で医師向け大規模言語モデル(LLM)を訓練または評価するためには、現実的な患者インタラクションシステムが必要です。しかし、既存のシミュレータは、臨床現場で見られる幅広い患者像を十分に反映できていないことが多いです。この問題を解決するため、私たちはPatientSimを導入しました。これは、医療専門知識に基づいて、臨床シナリオに適した現実的で多様な患者像を生成する患者シミュレータです。PatientSimは以下の要素を使用して動作します:1)MIMIC-EDおよびMIMIC-IVデータセットの実世界データから得られた症状や病歴を含む臨床プロファイル、2)性格、言語能力、病歴の記憶レベル、認知的な混乱レベルという4つの軸で定義された患者像で、これにより37種類のユニークな組み合わせが可能です。私たちは8つのLLMを事実の正確性と患者像の一貫性について評価しました。最も優れたオープンソースモデルであるLlama 3.3は、4人の臨床医によって検証され、フレームワークの堅牢性が確認されました。オープンソースでカスタマイズ可能なプラットフォームとして、PatientSimは特定の訓練ニーズに合わせてカスタマイズ可能な再現性と拡張性を備えたソリューションを提供します。プライバシーに準拠した環境を提供することで、多様な患者の症状に対する医療対話システムの評価のための堅牢なテストベッドとして機能し、医療教育ツールとしても有望です。
English
Doctor-patient consultations require multi-turn, context-aware communication tailored to diverse patient personas. Training or evaluating doctor LLMs in such settings requires realistic patient interaction systems. However, existing simulators often fail to reflect the full range of personas seen in clinical practice. To address this, we introduce PatientSim, a patient simulator that generates realistic and diverse patient personas for clinical scenarios, grounded in medical expertise. PatientSim operates using: 1) clinical profiles, including symptoms and medical history, derived from real-world data in the MIMIC-ED and MIMIC-IV datasets, and 2) personas defined by four axes: personality, language proficiency, medical history recall level, and cognitive confusion level, resulting in 37 unique combinations. We evaluated eight LLMs for factual accuracy and persona consistency. The top-performing open-source model, Llama 3.3, was validated by four clinicians to confirm the robustness of our framework. As an open-source, customizable platform, PatientSim provides a reproducible and scalable solution that can be customized for specific training needs. Offering a privacy-compliant environment, it serves as a robust testbed for evaluating medical dialogue systems across diverse patient presentations and shows promise as an educational tool for healthcare.

Summary

AI-Generated Summary

PDF112May 30, 2025