SEAD: Agente Auto-Evolvente per Dialoghi di Servizio Multi-Turn
SEAD: Self-Evolving Agent for Multi-Turn Service Dialogue
February 3, 2026
Autori: Yuqin Dai, Ning Gao, Wei Zhang, Jie Wang, Zichen Luo, Jinpeng Wang, Yujie Wang, Ruiyuan Wu, Chaozheng Wang
cs.AI
Abstract
I Large Language Model hanno dimostrato capacità notevoli nei dialogi a dominio aperto. Tuttavia, i metodi attuali mostrano prestazioni subottimali nei dialogi di servizio, poiché si basano su dati di conversazione umana rumorosi e di bassa qualità. Questa limitazione deriva dalla scarsità di dati e dalla difficoltà di simulare comportamenti utente autentici e orientati a uno scopo. Per affrontare questi problemi, proponiamo SEAD (Self-Evolving Agent for Service Dialogue), un framework che consente agli agenti di apprendere strategie efficaci senza l'uso di annotazioni umane su larga scala. SEAD scompone la modellazione dell'utente in due componenti: un Profile Controller che genera stati utente diversificati per gestire il curriculum di addestramento, e un User Role-play Model che si concentra sul role-playing realistico. Questo design garantisce che l'ambiente fornisca scenari di addestramento adattivi invece di agire come un avversario sleale. Gli esperimenti dimostrano che SEAD supera significativamente i Modelli Base Open-source e i Modelli Commerciali Closed-source, migliorando il tasso di completamento del task del 17.6% e l'efficienza del dialogo dell'11.1%. Il codice è disponibile all'indirizzo: https://github.com/Da1yuqin/SEAD.
English
Large Language Models have demonstrated remarkable capabilities in open-domain dialogues. However, current methods exhibit suboptimal performance in service dialogues, as they rely on noisy, low-quality human conversation data. This limitation arises from data scarcity and the difficulty of simulating authentic, goal-oriented user behaviors. To address these issues, we propose SEAD (Self-Evolving Agent for Service Dialogue), a framework that enables agents to learn effective strategies without large-scale human annotations. SEAD decouples user modeling into two components: a Profile Controller that generates diverse user states to manage training curriculum, and a User Role-play Model that focuses on realistic role-playing. This design ensures the environment provides adaptive training scenarios rather than acting as an unfair adversary. Experiments demonstrate that SEAD significantly outperforms Open-source Foundation Models and Closed-source Commercial Models, improving task completion rate by 17.6% and dialogue efficiency by 11.1%. Code is available at: https://github.com/Da1yuqin/SEAD.