Hacia un Diagnóstico Lingüístico de Emociones Eficiente y Robusto para la Salud Mental mediante el Refinamiento Multiagente de Instrucciones
Towards Efficient and Robust Linguistic Emotion Diagnosis for Mental Health via Multi-Agent Instruction Refinement
January 20, 2026
Autores: Jian Zhang, Zhangqi Wang, Zhiyuan Wang, Weiping Fu, Yu He, Haiping Zhu, Qika Lin, Jun Liu
cs.AI
Resumen
Las expresiones lingüísticas de emociones como la depresión, la ansiedad y los estados relacionados con el trauma son omnipresentes en las notas clínicas, los diálogos de consejería y las comunidades de salud mental en línea. El reconocimiento preciso de estas emociones es esencial para el triaje clínico, la evaluación de riesgos y la intervención oportuna. Aunque los grandes modelos de lenguaje (LLM, por sus siglas en inglés) han demostrado una fuerte capacidad de generalización en tareas de análisis de emociones, su fiabilidad diagnóstica en entornos médicos de alto riesgo y con gran carga contextual sigue siendo muy sensible al diseño de los *prompts*. Además, los métodos existentes enfrentan dos desafíos clave: la comorbilidad emocional, en la que múltiples estados emocionales interconectados complican la predicción, y la exploración ineficiente de indicios clínicamente relevantes. Para abordar estos desafíos, proponemos APOLO (Optimización Automatizada de *Prompts* para el Diagnóstico Lingüístico de Emociones), un marco que explora sistemáticamente un espacio de *prompts* más amplio y de grano más fino para mejorar la eficiencia y robustez diagnósticas. APOLO formula el refinamiento de instrucciones como un Proceso de Decisión Markoviano Parcialmente Observable y adopta un mecanismo de colaboración multiagente que involucra los roles de Planificador, Maestro, Crítico, Estudiante y Objetivo. Dentro de este marco de bucle cerrado, el Planificador define una trayectoria de optimización, mientras que los agentes Maestro-Crítico-Estudiante refinan iterativamente los *prompts* para mejorar la estabilidad y efectividad del razonamiento, y el agente Objetivo determina si continuar la optimización basándose en la evaluación del rendimiento. Los resultados experimentales muestran que APOLO mejora consistentemente la precisión y robustez diagnósticas en puntos de referencia estratificados y específicos del dominio, demostrando un paradigma escalable y generalizable para aplicaciones confiables de LLM en la atención de la salud mental.
English
Linguistic expressions of emotions such as depression, anxiety, and trauma-related states are pervasive in clinical notes, counseling dialogues, and online mental health communities, and accurate recognition of these emotions is essential for clinical triage, risk assessment, and timely intervention. Although large language models (LLMs) have demonstrated strong generalization ability in emotion analysis tasks, their diagnostic reliability in high-stakes, context-intensive medical settings remains highly sensitive to prompt design. Moreover, existing methods face two key challenges: emotional comorbidity, in which multiple intertwined emotional states complicate prediction, and inefficient exploration of clinically relevant cues. To address these challenges, we propose APOLO (Automated Prompt Optimization for Linguistic Emotion Diagnosis), a framework that systematically explores a broader and finer-grained prompt space to improve diagnostic efficiency and robustness. APOLO formulates instruction refinement as a Partially Observable Markov Decision Process and adopts a multi-agent collaboration mechanism involving Planner, Teacher, Critic, Student, and Target roles. Within this closed-loop framework, the Planner defines an optimization trajectory, while the Teacher-Critic-Student agents iteratively refine prompts to enhance reasoning stability and effectiveness, and the Target agent determines whether to continue optimization based on performance evaluation. Experimental results show that APOLO consistently improves diagnostic accuracy and robustness across domain-specific and stratified benchmarks, demonstrating a scalable and generalizable paradigm for trustworthy LLM applications in mental healthcare.