ChatPaper.aiChatPaper

감성 지원 대화에서 한 차례 발화 내 다중 지원 전략 모델링

Modeling Multiple Support Strategies within a Single Turn for Emotional Support Conversations

April 20, 2026
저자: Jie Zhu, Huaixia Dou, Junhui Li, Lifan Guo, Feng Chen, Jinsong Su, Chi Zhang, Fang Kong
cs.AI

초록

감정 지원 대화(ESC)는 공감과 지지를 담은 대화를 생성하여 고통을 겪는 개인을 돕는 것을 목표로 합니다. 기존 연구에서는 일반적으로 각 지원자의 발화가 단일 전략에 대응된다고 가정하지만, 실제 지원적 의사소통에서는 단일 발화 내에 여러 전략이 함께 사용되는 경우가 많습니다. 본 논문에서는 ESC 과제를 각 발화가 하나 이상의 전략-응답 쌍을 포함할 수 있는 다중 전략 발화 생성으로 재정의합니다. 우리는 두 가지 생성 방법을 제안합니다: 모든 전략-응답 쌍을 단일 디코딩 단계에서 예측하는 All-in-One 방식과, 완료될 때까지 전략-응답 쌍을 반복적으로 생성하는 One-by-One 방식입니다. 두 방법 모두 강화 학습을 통한 인지 추론을 추가하여 전략 선택과 응답 구성을 개선하였습니다. 우리는 ESConv 데이터셋에서 발화 수준과 대화 수준 설정 하에 모델을 평가합니다. 실험 결과, 우리의 방법이 다중 전략 발화를 효과적으로 모델링하며 지원 질과 대화 성공률을 향상시킴을 보여줍니다. 우리가 아는 한, 이 연구는 단일 발화 내에서 여러 지원 전략의 사용이 감정 지원 대화에 실현 가능하며 유익하다는 첫 체계적인 실증적 증거를 제시합니다. 모든 코드와 데이터는 https://github.com/aliyun/qwen-dianjin에서 공개될 예정입니다.
English
Emotional Support Conversation (ESC) aims to assist individuals experiencing distress by generating empathetic and supportive dialogue. While prior work typically assumes that each supporter turn corresponds to a single strategy, real-world supportive communication often involves multiple strategies within a single utterance. In this paper, we revisit the ESC task by formulating it as multi-strategy utterance generation, where each utterance may contain one or more strategy-response pairs. We propose two generation methods: All-in-One, which predicts all strategy-response pairs in a single decoding step, and One-by-One, which iteratively generates strategy-response pairs until completion. Both methods are further enhanced with cognitive reasoning guided by reinforcement learning to improve strategy selection and response composition. We evaluate our models on the ESConv dataset under both utterance-level and dialogue-level settings. Experimental results show that our methods effectively model multi-strategy utterances and lead to improved supportive quality and dialogue success. To our knowledge, this work provides the first systematic empirical evidence that allowing multiple support strategies within a single utterance is both feasible and beneficial for emotional support conversations. All code and data will be publicly available at https://github.com/aliyun/qwen-dianjin.
PDF12April 22, 2026