Reinventando o Diálogo Clínico: Paradigmas de Agência para Comunicação em Saúde Habilitada por LLM

Resumo

O diálogo clínico representa uma dualidade complexa que exige tanto a fluência empática da conversa natural quanto o rigor preciso da medicina baseada em evidências. Embora os Modelos de Linguagem de Grande Escala possuam capacidades linguísticas sem precedentes, sua dependência arquitetônica no processamento reativo e sem estado frequentemente favorece a plausibilidade probabilística em detrimento da veracidade factual. Esta limitação estrutural catalisou uma mudança de paradigma na IA médica, da previsão de texto generativa para a autonomia agentiva, onde o modelo funciona como um motor de raciocínio central capaz de planejamento deliberado e memória persistente. Indo além das revisões existentes que primariamente catalogam aplicações downstream, este estudo fornece uma análise de primeiros princípios da arquitetura cognitiva que sustenta essa mudança. Introduzimos uma taxonomia nova estruturada ao longo dos eixos ortogonais de fonte de conhecimento e objetivo de agência para delinear a proveniência do conhecimento clínico contra o escopo operacional do sistema. Esta estrutura facilita uma análise sistemática dos trade-offs intrínsecos entre criatividade e confiabilidade, categorizando os métodos em quatro arquétipos: Clínicos do Espaço Latente, Planejadores Emergentes, Sintetizadores Aterrados e Autômatos de Fluxo de Trabalho Verificáveis. Para cada paradigma, desconstruímos a realização técnica em todo o pipeline cognitivo, abrangendo planejamento estratégico, gestão de memória, execução de ações, colaboração e evolução, para revelar como escolhas arquitetônicas distintas equilibram a tensão entre autonomia e segurança.

English

Clinical dialogue represents a complex duality requiring both the empathetic fluency of natural conversation and the rigorous precision of evidence-based medicine. While Large Language Models possess unprecedented linguistic capabilities, their architectural reliance on reactive and stateless processing often favors probabilistic plausibility over factual veracity. This structural limitation has catalyzed a paradigm shift in medical AI from generative text prediction to agentic autonomy, where the model functions as a central reasoning engine capable of deliberate planning and persistent memory. Moving beyond existing reviews that primarily catalog downstream applications, this survey provides a first-principles analysis of the cognitive architecture underpinning this shift. We introduce a novel taxonomy structured along the orthogonal axes of knowledge source and agency objective to delineate the provenance of clinical knowledge against the system's operational scope. This framework facilitates a systematic analysis of the intrinsic trade-offs between creativity and reliability by categorizing methods into four archetypes: Latent Space Clinicians, Emergent Planners, Grounded Synthesizers, and Verifiable Workflow Automators. For each paradigm, we deconstruct the technical realization across the entire cognitive pipeline, encompassing strategic planning, memory management, action execution, collaboration, and evolution to reveal how distinct architectural choices balance the tension between autonomy and safety.