임상 대화의 재구성: LLM 기반 의료 커뮤니케이션을 위한 주체적 패러다임
Reinventing Clinical Dialogue: Agentic Paradigms for LLM Enabled Healthcare Communication
December 1, 2025
저자: Xiaoquan Zhi, Hongke Zhao, Likang Wu, Chuang Zhao, Hengshu Zhu
cs.AI
초록
임상 대화는 자연스러운 대화의 공감적 유창성과 증거 기반 의학의 엄격한 정밀성을 모두 요구하는 복잡한 이중성을 나타냅니다. 대규모 언어 모델은 전례 없는 언어 능력을 보유하고 있지만, 반응형 및 상태 비저장 처리에 대한 구조적 의존성으로 인해 사실적 정확성보다 확률적 타당성을 선호하는 경향이 있습니다. 이러한 구조적 한계는 의료 AI 분야에서 생성형 텍스트 예측에서 능동적 자율성으로의 패러다임 전환을 촉진하였으며, 여기서 모델은 신중한 계획과 지속적 메모리가 가능한 중추적 추론 엔진으로 기능합니다. 하류 응용 프로그램을 주로 분류하는 기존 논평을 넘어, 본 고찰은 이러한 전환을 지탱하는 인지 아키텍처에 대한 원리 기반 분석을 제공합니다. 우리는 지식 출처와 행위 주체성 목표라는 직교 축을 따라 구조화된 새로운 분류 체계를 도입하여 시스템의 운영 범위 대비 임상 지식의 기원을 명확히 합니다. 이 프레임워크는 방법론을 네 가지 원형(잠재 공간 임상의, 창발적 계획자, 접지된 종합자, 검증 가능한 워크플로 자동화 도구)으로 범주화함으로써 창의성과 신뢰성 간의 내재적 트레이드오프에 대한 체계적인 분석을 용이하게 합니다. 각 패러다임에 대해 우리는 전략적 계획, 메모리 관리, 행동 실행, 협업, 진화를 아우르는 전체 인지 파이프라인에 걸친 기술적 구현을 해체하여 상이한 아키텍처 선택이 자율성과 안전성 간의 긴장을 어떻게 균형 있게 조절하는지 밝힙니다.
English
Clinical dialogue represents a complex duality requiring both the empathetic fluency of natural conversation and the rigorous precision of evidence-based medicine. While Large Language Models possess unprecedented linguistic capabilities, their architectural reliance on reactive and stateless processing often favors probabilistic plausibility over factual veracity. This structural limitation has catalyzed a paradigm shift in medical AI from generative text prediction to agentic autonomy, where the model functions as a central reasoning engine capable of deliberate planning and persistent memory. Moving beyond existing reviews that primarily catalog downstream applications, this survey provides a first-principles analysis of the cognitive architecture underpinning this shift. We introduce a novel taxonomy structured along the orthogonal axes of knowledge source and agency objective to delineate the provenance of clinical knowledge against the system's operational scope. This framework facilitates a systematic analysis of the intrinsic trade-offs between creativity and reliability by categorizing methods into four archetypes: Latent Space Clinicians, Emergent Planners, Grounded Synthesizers, and Verifiable Workflow Automators. For each paradigm, we deconstruct the technical realization across the entire cognitive pipeline, encompassing strategic planning, memory management, action execution, collaboration, and evolution to reveal how distinct architectural choices balance the tension between autonomy and safety.