SEAD: Agente de Auto-Evolução para Diálogo de Serviço em Múltiplos Turnos

Resumo

Os Grandes Modelos de Linguagem demonstraram capacidades notáveis em diálogos de domínio aberto. No entanto, os métodos atuais apresentam desempenho abaixo do ideal em diálogos de serviço, uma vez que dependem de dados de conversação humana ruidosos e de baixa qualidade. Esta limitação surge da escassez de dados e da dificuldade em simular comportamentos autênticos e orientados a objetivos do utilizador. Para resolver estas questões, propomos o SEAD (Agente de Auto-Evolução para Diálogo de Serviço), uma estrutura que permite aos agentes aprender estratégias eficazes sem anotações humanas em larga escala. O SEAD desacopla a modelagem do utilizador em dois componentes: um Controlador de Perfil que gera estados de utilizador diversos para gerir o currículo de treino, e um Modelo de Simulação de Papel do Utilizador que se foca na representação realista de papéis. Este projeto garante que o ambiente fornece cenários de treino adaptativos em vez de atuar como um adversário injusto. Experiências demonstram que o SEAD supera significativamente os Modelos de Base de Código Aberto e os Modelos Comerciais de Código Fechado, melhorando a taxa de conclusão de tarefas em 17,6% e a eficiência do diálogo em 11,1%. O código está disponível em: https://github.com/Da1yuqin/SEAD.

English

Large Language Models have demonstrated remarkable capabilities in open-domain dialogues. However, current methods exhibit suboptimal performance in service dialogues, as they rely on noisy, low-quality human conversation data. This limitation arises from data scarcity and the difficulty of simulating authentic, goal-oriented user behaviors. To address these issues, we propose SEAD (Self-Evolving Agent for Service Dialogue), a framework that enables agents to learn effective strategies without large-scale human annotations. SEAD decouples user modeling into two components: a Profile Controller that generates diverse user states to manage training curriculum, and a User Role-play Model that focuses on realistic role-playing. This design ensures the environment provides adaptive training scenarios rather than acting as an unfair adversary. Experiments demonstrate that SEAD significantly outperforms Open-source Foundation Models and Closed-source Commercial Models, improving task completion rate by 17.6% and dialogue efficiency by 11.1%. Code is available at: https://github.com/Da1yuqin/SEAD.