SEAD: Selbst-evolvierender Agent für mehrfach-wechselnde Servicedialoge
SEAD: Self-Evolving Agent for Multi-Turn Service Dialogue
February 3, 2026
Autoren: Yuqin Dai, Ning Gao, Wei Zhang, Jie Wang, Zichen Luo, Jinpeng Wang, Yujie Wang, Ruiyuan Wu, Chaozheng Wang
cs.AI
Zusammenfassung
Große Sprachmodelle haben bemerkenswerte Fähigkeiten in offenen Dialogen gezeigt. Allerdings weisen aktuelle Methoden suboptimale Leistungen in Servicedialogen auf, da sie auf verrauschte, minderwertige menschliche Konversationsdaten angewiesen sind. Diese Einschränkung ergibt sich aus Datenknappheit und der Schwierigkeit, authentische, zielorientierte Nutzerverhalten zu simulieren. Um diese Probleme zu adressieren, schlagen wir SEAD (Self-Evolving Agent for Service Dialogue) vor, ein Framework, das Agenten ermöglicht, effektive Strategien ohne umfangreiche menschliche Annotationen zu erlernen. SEAD entkoppelt die Nutzermodellierung in zwei Komponenten: einen Profil-Controller, der diverse Nutzerzustände zur Steuerung des Trainingscurriculums generiert, und ein User Role-play Model, das sich auf realistisches Rollenspiel konzentriert. Dieses Design stellt sicher, dass die Umgebung adaptive Trainingsszenarien bereitstellt, anstatt als unfaire Gegenpartei zu agieren. Experimente zeigen, dass SEAD Open-Source-Basismodelle und proprietäre kommerzielle Modelle signifikant übertrifft und die Aufgabenabschlussrate um 17,6 % sowie die Dialogeffizienz um 11,1 % steigert. Code ist verfügbar unter: https://github.com/Da1yuqin/SEAD.
English
Large Language Models have demonstrated remarkable capabilities in open-domain dialogues. However, current methods exhibit suboptimal performance in service dialogues, as they rely on noisy, low-quality human conversation data. This limitation arises from data scarcity and the difficulty of simulating authentic, goal-oriented user behaviors. To address these issues, we propose SEAD (Self-Evolving Agent for Service Dialogue), a framework that enables agents to learn effective strategies without large-scale human annotations. SEAD decouples user modeling into two components: a Profile Controller that generates diverse user states to manage training curriculum, and a User Role-play Model that focuses on realistic role-playing. This design ensures the environment provides adaptive training scenarios rather than acting as an unfair adversary. Experiments demonstrate that SEAD significantly outperforms Open-source Foundation Models and Closed-source Commercial Models, improving task completion rate by 17.6% and dialogue efficiency by 11.1%. Code is available at: https://github.com/Da1yuqin/SEAD.