ChatPaper.aiChatPaper

Neuerfindung des klinischen Dialogs: Agentenbasierte Paradigmen für KI-gestützte Kommunikation im Gesundheitswesen

Reinventing Clinical Dialogue: Agentic Paradigms for LLM Enabled Healthcare Communication

December 1, 2025
papers.authors: Xiaoquan Zhi, Hongke Zhao, Likang Wu, Chuang Zhao, Hengshu Zhu
cs.AI

papers.abstract

Klinische Dialoge verkörpern eine komplexe Dualität, die sowohl die empathische Flüssigkeit natürlicher Konversation als auch die strenge Präzision evidenzbasierter Medizin erfordert. Während Large Language Models über beispiellose linguistische Fähigkeiten verfügen, begünstigt ihre architektonische Abhängigkeit von reaktiver und zustandsloser Verarbeitung oft probabilistische Plausibilität gegenüber faktischer Korrektheit. Diese strukturelle Limitation hat einen Paradigmenwechsel in der medizinischen KI katalysiert – von generativer Textvorhersage hin zu agentenbasierter Autonomie, bei der das Modell als zentrale Reasoning-Engine fungiert, die zu deliberatem Planen und persistenter Speicherung fähig ist. Über bestehende Übersichtsarbeiten hinausgehend, die primär Downstream-Anwendungen katalogisieren, bietet dieser Survey eine Analyse der kognitiven Architektur dieses Wandels aus ersten Prinzipien. Wir führen eine neuartige Taxonomie ein, die entlang der orthogonalen Achsen Wissensquelle und Agentenziele strukturiert ist, um die Herkunft klinischen Wissens gegen den operationellen Scope des Systems abzugrenzen. Dieser Rahmen ermöglicht eine systematische Analyse der intrinsischen Trade-offs zwischen Kreativität und Verlässlichkeit, indem Methoden in vier Archetypen kategorisiert werden: Latent Space Clinicians, Emergent Planners, Grounded Synthesizers und Verifiable Workflow Automators. Für jedes Paradigma dekonstruieren wir die technische Realisierung entlang der gesamten kognitiven Pipeline – strategische Planung, Speicherverwaltung, Aktionsausführung, Kollaboration und Evolution – um aufzuzeigen, wie unterschiedliche Architekturentscheidungen die Spannung zwischen Autonomie und Sicherheit austarieren.
English
Clinical dialogue represents a complex duality requiring both the empathetic fluency of natural conversation and the rigorous precision of evidence-based medicine. While Large Language Models possess unprecedented linguistic capabilities, their architectural reliance on reactive and stateless processing often favors probabilistic plausibility over factual veracity. This structural limitation has catalyzed a paradigm shift in medical AI from generative text prediction to agentic autonomy, where the model functions as a central reasoning engine capable of deliberate planning and persistent memory. Moving beyond existing reviews that primarily catalog downstream applications, this survey provides a first-principles analysis of the cognitive architecture underpinning this shift. We introduce a novel taxonomy structured along the orthogonal axes of knowledge source and agency objective to delineate the provenance of clinical knowledge against the system's operational scope. This framework facilitates a systematic analysis of the intrinsic trade-offs between creativity and reliability by categorizing methods into four archetypes: Latent Space Clinicians, Emergent Planners, Grounded Synthesizers, and Verifiable Workflow Automators. For each paradigm, we deconstruct the technical realization across the entire cognitive pipeline, encompassing strategic planning, memory management, action execution, collaboration, and evolution to reveal how distinct architectural choices balance the tension between autonomy and safety.
PDF12December 13, 2025