臨床対話の再構築:LLMを活用した医療コミュニケーションにおけるエージェント的パラダイム
Reinventing Clinical Dialogue: Agentic Paradigms for LLM Enabled Healthcare Communication
December 1, 2025
著者: Xiaoquan Zhi, Hongke Zhao, Likang Wu, Chuang Zhao, Hengshu Zhu
cs.AI
要旨
臨床対話は、自然な会話に必要な共感的な流暢さと、根拠に基づく医療が求める厳密な正確性という、複雑な二重性を内包する。大規模言語モデルは前例のない言語能力を有するが、そのアーキテクチャが反応的かつステートレスな処理に依存する性質上、確率的な尤もらしさが事実の正確性よりも優先されがちである。この構造的限界は、医療AIのパラダイムを生成的テキスト予測から、意図的な計画と持続的メモリを可能とする中核的推論エンジンとして機能するエージェント的自律性へと移行させる触媒となった。従来のレビューが主に下流応用を列挙するにとどまる中、本調査はこの変遷を支える認知アーキテクチャを第一原理から分析する。我々は、知識源とエージェンシーの目的という直交する軸に沿って構築された新たな分類体系を提案し、臨床知識の由来をシステムの運用範囲に対比して明らかにする。この枠組みにより、手法を「潜在空間臨床医」「創発的プランナー」「接地型統合器」「検証可能ワークフロー自動化器」という4つの原型に分類し、創造性と信頼性の間の本質的トレードオフを体系的に分析する。各パラダイムについて、戦略的計画、メモリ管理、行動実行、協調、進化という認知パイプライン全体にわたる技術的実現方法を解明し、異なるアーキテクチャ選択が如何に自律性と安全性の緊張関係をバランスさせるかを明らかにする。
English
Clinical dialogue represents a complex duality requiring both the empathetic fluency of natural conversation and the rigorous precision of evidence-based medicine. While Large Language Models possess unprecedented linguistic capabilities, their architectural reliance on reactive and stateless processing often favors probabilistic plausibility over factual veracity. This structural limitation has catalyzed a paradigm shift in medical AI from generative text prediction to agentic autonomy, where the model functions as a central reasoning engine capable of deliberate planning and persistent memory. Moving beyond existing reviews that primarily catalog downstream applications, this survey provides a first-principles analysis of the cognitive architecture underpinning this shift. We introduce a novel taxonomy structured along the orthogonal axes of knowledge source and agency objective to delineate the provenance of clinical knowledge against the system's operational scope. This framework facilitates a systematic analysis of the intrinsic trade-offs between creativity and reliability by categorizing methods into four archetypes: Latent Space Clinicians, Emergent Planners, Grounded Synthesizers, and Verifiable Workflow Automators. For each paradigm, we deconstruct the technical realization across the entire cognitive pipeline, encompassing strategic planning, memory management, action execution, collaboration, and evolution to reveal how distinct architectural choices balance the tension between autonomy and safety.