SEAD: Саморазвивающийся агент для многоходового сервисного диалога
SEAD: Self-Evolving Agent for Multi-Turn Service Dialogue
February 3, 2026
Авторы: Yuqin Dai, Ning Gao, Wei Zhang, Jie Wang, Zichen Luo, Jinpeng Wang, Yujie Wang, Ruiyuan Wu, Chaozheng Wang
cs.AI
Аннотация
Крупные языковые модели продемонстрировали впечатляющие возможности в открытых диалоговых доменах. Однако современные методы демонстрируют неоптимальную производительность в сервисных диалогах, поскольку опираются на зашумленные, низкокачественные данные человеческих разговоров. Это ограничение возникает из-за дефицита данных и сложности моделирования аутентичного целенаправленного поведения пользователей. Для решения этих проблем мы предлагаем SEAD (Self-Evolving Agent for Service Dialogue) — фреймворк, позволяющий агентам обучаться эффективным стратегиям без масштабных человеческих аннотаций. SEAD разделяет моделирование пользователя на два компонента: Контроллер профилей, генерирующий разнообразные пользовательские состояния для управления учебным планом, и Модель ролевой игры пользователя, ориентированную на реалистичное воплощение ролей. Такая конструкция гарантирует, что среда предоставляет адаптивные учебные сценарии вместо роли несправедливого противника. Эксперименты показывают, что SEAD значительно превосходит открытые базовые модели и проприетарные коммерческие модели, повышая коэффициент завершения задач на 17,6% и эффективность диалога на 11,1%. Код доступен по адресу: https://github.com/Da1yuqin/SEAD.
English
Large Language Models have demonstrated remarkable capabilities in open-domain dialogues. However, current methods exhibit suboptimal performance in service dialogues, as they rely on noisy, low-quality human conversation data. This limitation arises from data scarcity and the difficulty of simulating authentic, goal-oriented user behaviors. To address these issues, we propose SEAD (Self-Evolving Agent for Service Dialogue), a framework that enables agents to learn effective strategies without large-scale human annotations. SEAD decouples user modeling into two components: a Profile Controller that generates diverse user states to manage training curriculum, and a User Role-play Model that focuses on realistic role-playing. This design ensures the environment provides adaptive training scenarios rather than acting as an unfair adversary. Experiments demonstrate that SEAD significantly outperforms Open-source Foundation Models and Closed-source Commercial Models, improving task completion rate by 17.6% and dialogue efficiency by 11.1%. Code is available at: https://github.com/Da1yuqin/SEAD.