SEAD: マルチターンサービス対話のための自己進化エージェント
SEAD: Self-Evolving Agent for Multi-Turn Service Dialogue
February 3, 2026
著者: Yuqin Dai, Ning Gao, Wei Zhang, Jie Wang, Zichen Luo, Jinpeng Wang, Yujie Wang, Ruiyuan Wu, Chaozheng Wang
cs.AI
要旨
大規模言語モデルはオープンドメイン対話において顕著な能力を発揮している。しかし、現在の手法はノイズの多い低品質な人間の会話データに依存するため、サービス対話では最適な性能を発揮していない。この制約は、データ不足と、本物の目標指向的なユーザー行動を模倣する難しさに起因する。これらの課題に対処するため、我々は大規模な人間の注釈を必要とせずにエージェントが効果的な戦略を学習できるフレームワーク「SEAD(サービス対話のための自己進化エージェント)」を提案する。SEADはユーザーモデリングを二つの要素に分離する:訓練カリキュラムを管理する多様なユーザー状態を生成するプロファイルコントローラーと、現実的な役割演技に焦点を当てたユーザー役割演技モデルである。この設計により、環境が不公平な敵対者として振る舞うのではなく、適応的な訓練シナリオを提供することが保証される。実験により、SEADがオープンソース基盤モデルおよびクローズドソース商用モデルを大幅に上回り、タスク完了率を17.6%、対話効率を11.1%向上させることが実証された。コードは以下で公開されている:https://github.com/Da1yuqin/SEAD
English
Large Language Models have demonstrated remarkable capabilities in open-domain dialogues. However, current methods exhibit suboptimal performance in service dialogues, as they rely on noisy, low-quality human conversation data. This limitation arises from data scarcity and the difficulty of simulating authentic, goal-oriented user behaviors. To address these issues, we propose SEAD (Self-Evolving Agent for Service Dialogue), a framework that enables agents to learn effective strategies without large-scale human annotations. SEAD decouples user modeling into two components: a Profile Controller that generates diverse user states to manage training curriculum, and a User Role-play Model that focuses on realistic role-playing. This design ensures the environment provides adaptive training scenarios rather than acting as an unfair adversary. Experiments demonstrate that SEAD significantly outperforms Open-source Foundation Models and Closed-source Commercial Models, improving task completion rate by 17.6% and dialogue efficiency by 11.1%. Code is available at: https://github.com/Da1yuqin/SEAD.