ChatPaper.aiChatPaper

SEAD: Zelf-evoluerende agent voor meerronde servicedialogen

SEAD: Self-Evolving Agent for Multi-Turn Service Dialogue

February 3, 2026
Auteurs: Yuqin Dai, Ning Gao, Wei Zhang, Jie Wang, Zichen Luo, Jinpeng Wang, Yujie Wang, Ruiyuan Wu, Chaozheng Wang
cs.AI

Samenvatting

Grote taalmodel(len) hebben opmerkelijke capaciteiten getoond in open-domein dialogen. Huidige methoden presteren echter suboptimaal in servicedialogen, omdat ze steunen op rumoerige, laagkwalitatieve menselijke gespreksdata. Deze beperking ontstaat door dataschaarste en de moeilijkheid om authentiek, doelgericht gebruikersgedrag te simuleren. Om deze problemen aan te pakken, stellen wij SEAD voor (Self-Evolving Agent for Service Dialogue), een raamwerk dat agents in staat stelt effectieve strategieën te leren zonder grootschalige menselijke annotaties. SEAD ontkoppelt gebruikersmodellering in twee componenten: een Profielcontroller die diverse gebruikersstatussen genereert om de trainingscurricula te beheren, en een Gebruikersrolspelmodel dat zich richt op realistisch rollenspel. Dit ontwerp zorgt ervoor dat de omgeving adaptieve trainingsscenario's biedt in plaats van als een oneerlijke tegenstander op te treden. Experimenten tonen aan dat SEAD aanzienlijk beter presteert dan open-source basis- en gesloten bron commerciële modellen, waarbij de taakvoltooiingsratio met 17,6% en de dialoogefficiëntie met 11,1% verbetert. Code is beschikbaar op: https://github.com/Da1yuqin/SEAD.
English
Large Language Models have demonstrated remarkable capabilities in open-domain dialogues. However, current methods exhibit suboptimal performance in service dialogues, as they rely on noisy, low-quality human conversation data. This limitation arises from data scarcity and the difficulty of simulating authentic, goal-oriented user behaviors. To address these issues, we propose SEAD (Self-Evolving Agent for Service Dialogue), a framework that enables agents to learn effective strategies without large-scale human annotations. SEAD decouples user modeling into two components: a Profile Controller that generates diverse user states to manage training curriculum, and a User Role-play Model that focuses on realistic role-playing. This design ensures the environment provides adaptive training scenarios rather than acting as an unfair adversary. Experiments demonstrate that SEAD significantly outperforms Open-source Foundation Models and Closed-source Commercial Models, improving task completion rate by 17.6% and dialogue efficiency by 11.1%. Code is available at: https://github.com/Da1yuqin/SEAD.
PDF43March 16, 2026