Reinventando el Diálogo Clínico: Paradigmas Agénticos para la Comunicación Sanitaria Habilitada por Modelos de Lenguaje Grande
Reinventing Clinical Dialogue: Agentic Paradigms for LLM Enabled Healthcare Communication
December 1, 2025
Autores: Xiaoquan Zhi, Hongke Zhao, Likang Wu, Chuang Zhao, Hengshu Zhu
cs.AI
Resumen
El diálogo clínico representa una dualidad compleja que requiere tanto la fluidez empática de la conversación natural como el rigor preciso de la medicina basada en la evidencia. Si bien los Modelos de Lenguaje a Gran Escala poseen capacidades lingüísticas sin precedentes, su dependencia arquitectónica en el procesamiento reactivo y sin estado a menudo favorece la plausibilidad probabilística sobre la veracidad fáctica. Esta limitación estructural ha catalizado un cambio de paradigma en la IA médica, pasando de la predicción generativa de texto a la autonomía agéntica, donde el modelo funciona como un motor de razonamiento central capaz de realizar planificación deliberada y mantener memoria persistente. Yendo más allá de las revisiones existentes que principalmente catalogan aplicaciones derivadas, este estudio proporciona un análisis de primeros principios de la arquitectura cognitiva que sustenta este cambio. Introducimos una taxonomía novedosa estructurada a lo largo de los ejes ortogonales de fuente de conocimiento y objetivo de agencia para delinear la procedencia del conocimiento clínico frente al alcance operativo del sistema. Este marco facilita un análisis sistemático de las compensaciones intrínsecas entre creatividad y fiabilidad al categorizar los métodos en cuatro arquetipos: Clínicos del Espacio Latente, Planificadores Emergentes, Sintetizadores Fundamentados y Automatizadores de Flujos de Trabajo Verificables. Para cada paradigma, deconstruimos la realización técnica a lo largo de toda la canalización cognitiva, abarcando la planificación estratégica, la gestión de la memoria, la ejecución de acciones, la colaboración y la evolución, para revelar cómo distintas elecciones arquitectónicas equilibran la tensión entre autonomía y seguridad.
English
Clinical dialogue represents a complex duality requiring both the empathetic fluency of natural conversation and the rigorous precision of evidence-based medicine. While Large Language Models possess unprecedented linguistic capabilities, their architectural reliance on reactive and stateless processing often favors probabilistic plausibility over factual veracity. This structural limitation has catalyzed a paradigm shift in medical AI from generative text prediction to agentic autonomy, where the model functions as a central reasoning engine capable of deliberate planning and persistent memory. Moving beyond existing reviews that primarily catalog downstream applications, this survey provides a first-principles analysis of the cognitive architecture underpinning this shift. We introduce a novel taxonomy structured along the orthogonal axes of knowledge source and agency objective to delineate the provenance of clinical knowledge against the system's operational scope. This framework facilitates a systematic analysis of the intrinsic trade-offs between creativity and reliability by categorizing methods into four archetypes: Latent Space Clinicians, Emergent Planners, Grounded Synthesizers, and Verifiable Workflow Automators. For each paradigm, we deconstruct the technical realization across the entire cognitive pipeline, encompassing strategic planning, memory management, action execution, collaboration, and evolution to reveal how distinct architectural choices balance the tension between autonomy and safety.