ChatPaper.aiChatPaper

정신 건강을 위한 효율적이고 강건한 언어적 감정 진단을 위한 다중 에이전트 지령 정제

Towards Efficient and Robust Linguistic Emotion Diagnosis for Mental Health via Multi-Agent Instruction Refinement

January 20, 2026
저자: Jian Zhang, Zhangqi Wang, Zhiyuan Wang, Weiping Fu, Yu He, Haiping Zhu, Qika Lin, Jun Liu
cs.AI

초록

우울증, 불안, 외상 관련 상태와 같은 정서의 언어적 표현은 임상 기록, 상담 대화, 온라인 정신건강 커뮤니티에서 흔히 발견되며, 이러한 정서를 정확하게 인식하는 것은 임상 분류, 위험 평가 및 적시 개입에 필수적입니다. 대규모 언어 모델(LLM)이 정서 분석 과제에서 강력한 일반화 능력을 입증했으나, 위험도가 높고 맥락이 복잡한 의료 현장에서의 진단 신뢰도는 프롬프트 설계에 매우 민감합니다. 더욱이 기존 방법론은 정서 공존병리(여러 정서 상태가 복합적으로 얽혀 예측을 어렵게 함)와 임상적 관련 단서의 비효율적 탐색이라는 두 가지 주요 과제에 직면해 있습니다. 이러한 과제를 해결하기 위해 우리는 진단 효율성과 강건성을 향상시키기 위해 더 넓고 세분화된 프롬프트 공간을 체계적으로 탐색하는 APOLO(Automated Prompt Optimization for Linguistic Emotion Diagnosis) 프레임워크를 제안합니다. APOLO는 지침 개선을 부분 관측 마르코프 결정 과정으로 공식화하고, Planner, Teacher, Critic, Student, Target 역할로 구성된 다중 에이전트 협업 메커니즘을 채택합니다. 이 폐쇄형 루프 프레임워크 내에서 Planner는 최적화 궤적을 정의하고, Teacher-Critic-Student 에이전트는 추론의 안정성과 효과성을 높이기 위해 프롬프트를 반복적으로 개선하며, Target 에이전트는 성능 평가를 기반으로 최적화를 계속할지 여부를 결정합니다. 실험 결과, APOLO는 도메인 특화 및 계층화된 벤치마크에서 진단 정확도와 강건성을 지속적으로 향상시켜, 정신건강 관리 분야에서 신뢰할 수 있는 LLM 응용을 위한 확장 가능하고 일반화 가능한 패러다임을 입증했습니다.
English
Linguistic expressions of emotions such as depression, anxiety, and trauma-related states are pervasive in clinical notes, counseling dialogues, and online mental health communities, and accurate recognition of these emotions is essential for clinical triage, risk assessment, and timely intervention. Although large language models (LLMs) have demonstrated strong generalization ability in emotion analysis tasks, their diagnostic reliability in high-stakes, context-intensive medical settings remains highly sensitive to prompt design. Moreover, existing methods face two key challenges: emotional comorbidity, in which multiple intertwined emotional states complicate prediction, and inefficient exploration of clinically relevant cues. To address these challenges, we propose APOLO (Automated Prompt Optimization for Linguistic Emotion Diagnosis), a framework that systematically explores a broader and finer-grained prompt space to improve diagnostic efficiency and robustness. APOLO formulates instruction refinement as a Partially Observable Markov Decision Process and adopts a multi-agent collaboration mechanism involving Planner, Teacher, Critic, Student, and Target roles. Within this closed-loop framework, the Planner defines an optimization trajectory, while the Teacher-Critic-Student agents iteratively refine prompts to enhance reasoning stability and effectiveness, and the Target agent determines whether to continue optimization based on performance evaluation. Experimental results show that APOLO consistently improves diagnostic accuracy and robustness across domain-specific and stratified benchmarks, demonstrating a scalable and generalizable paradigm for trustworthy LLM applications in mental healthcare.
PDF22January 25, 2026