ChatPaper.aiChatPaper

Vers une évaluation linguistique des émotions efficace et robuste pour la santé mentale via un raffinement multi-agent des instructions

Towards Efficient and Robust Linguistic Emotion Diagnosis for Mental Health via Multi-Agent Instruction Refinement

January 20, 2026
papers.authors: Jian Zhang, Zhangqi Wang, Zhiyuan Wang, Weiping Fu, Yu He, Haiping Zhu, Qika Lin, Jun Liu
cs.AI

papers.abstract

Les expressions linguistiques d'émotions telles que la dépression, l'anxiété et les états liés au trauma sont omniprésentes dans les comptes rendus cliniques, les dialogues de conseil et les communautés en ligne de santé mentale. Leur reconnaissance précise est essentielle pour le triage clinique, l'évaluation des risques et l'intervention rapide. Bien que les grands modèles de langage (LLM) aient démontré une forte capacité de généralisation dans les tâches d'analyse émotionnelle, leur fiabilité diagnostique dans des contextes médicaux à enjeux élevés et riches en contexte reste très sensible à la conception des prompts. De plus, les méthodes existantes se heurtent à deux défis majeurs : la comorbidité émotionnelle, où plusieurs états émotionnels entremêlés complexifient la prédiction, et l'exploration inefficace des indices cliniquement pertinents. Pour relever ces défis, nous proposons APOLO (Optimisation Automatisée des Prompts pour le Diagnostic Émotionnel Linguistique), un cadre explorant systématiquement un espace de prompts plus vaste et plus fin pour améliorer l'efficacité et la robustesse diagnostiques. APOLO formule l'affinement des instructions comme un Processus de Décision Markovien Partiellement Observable et adopte un mécanisme de collaboration multi-agents impliquant les rôles de Planificateur, Enseignant, Critique, Élève et Cible. Dans ce cadre en boucle fermée, le Planificateur définit une trajectoire d'optimisation, tandis que les agents Enseignant-Critique-Élève affinent itérativement les prompts pour renforcer la stabilité et l'efficacité du raisonnement. L'agent Cible détermine quant à lui la poursuite ou l'arrêt de l'optimisation sur la base de l'évaluation des performances. Les résultats expérimentaux montrent qu'APOLO améliore constamment la précision et la robustesse diagnostiques sur des benchmarks domain-spécifiques et stratifiés, démontrant un paradigme scalable et généralisable pour des applications LLM dignes de confiance dans les soins de santé mentale.
English
Linguistic expressions of emotions such as depression, anxiety, and trauma-related states are pervasive in clinical notes, counseling dialogues, and online mental health communities, and accurate recognition of these emotions is essential for clinical triage, risk assessment, and timely intervention. Although large language models (LLMs) have demonstrated strong generalization ability in emotion analysis tasks, their diagnostic reliability in high-stakes, context-intensive medical settings remains highly sensitive to prompt design. Moreover, existing methods face two key challenges: emotional comorbidity, in which multiple intertwined emotional states complicate prediction, and inefficient exploration of clinically relevant cues. To address these challenges, we propose APOLO (Automated Prompt Optimization for Linguistic Emotion Diagnosis), a framework that systematically explores a broader and finer-grained prompt space to improve diagnostic efficiency and robustness. APOLO formulates instruction refinement as a Partially Observable Markov Decision Process and adopts a multi-agent collaboration mechanism involving Planner, Teacher, Critic, Student, and Target roles. Within this closed-loop framework, the Planner defines an optimization trajectory, while the Teacher-Critic-Student agents iteratively refine prompts to enhance reasoning stability and effectiveness, and the Target agent determines whether to continue optimization based on performance evaluation. Experimental results show that APOLO consistently improves diagnostic accuracy and robustness across domain-specific and stratified benchmarks, demonstrating a scalable and generalizable paradigm for trustworthy LLM applications in mental healthcare.
PDF22January 25, 2026