ChatPaper.aiChatPaper

Génération de dialogues multi-tours centrée sur l'utilisateur avec utilisation d'outils à grande échelle

User-Oriented Multi-Turn Dialogue Generation with Tool Use at scale

January 13, 2026
papers.authors: Jungho Cho, Minbyul Jeong, Sungrae Park
cs.AI

papers.abstract

Le récent changement de paradigme vers les grands modèles de raisonnement (LRM) en tant qu'agents autonomes a intensifié la demande de capacités sophistiquées d'utilisation d'outils en conversations multiples. Cependant, les ensembles de données existants et les approches de génération de données sont limités par des ensembles d'outils statiques et prédéfinis qui ne peuvent pas s'adapter à la complexité de la collaboration ouverte entre humains et agents. Pour y remédier, nous avons initialement développé un cadre pour la génération automatique à grande échelle de dialogues multi-tours orientés tâche, utilisant un simulateur basé sur un LRM pour générer dynamiquement des outils à forte valeur ajoutée et spécifiques à un domaine afin de résoudre des tâches données. Cependant, nous observons qu'une conception purement axée sur la tâche produit souvent des trajectoires de "résolution unique de tâche", où l'agent atteint l'objectif avec une interaction minimale, sans générer les conversations à nombreux tours typiques des scénarios réalistes. Pour combler cette lacune, nous nous orientons vers un paradigme de simulation centré sur l'utilisateur. En dissociant la génération de tâches d'un simulateur d'utilisateur dédié qui reproduit les comportements humains - tels que la formulation de demandes incrémentielles et les retours d'information tour par tour - nous favorisons des dialogues multi-tours plus authentiques et prolongés, reflétant la nature itérative de la résolution de problèmes réels. Notre pipeline de génération fonctionne comme un module polyvalent plug-and-play capable d'initier la génération à partir de n'importe quel état, garantissant une grande évolutivité dans la production de données étendues sur l'utilisation d'outils. De plus, en permettant l'accomplissement de multiples tâches dans une seule trajectoire, il produit un jeu de données à haute densité qui reflète les demandes multidimensionnelles des interactions réelles entre humains et agents.
English
The recent paradigm shift toward large reasoning models (LRMs) as autonomous agents has intensified the demand for sophisticated, multi-turn tool-use capabilities. Yet, existing datasets and data-generation approaches are limited by static, predefined toolsets that cannot scale to the complexity of open-ended human-agent collaboration. To address this, we initially developed a framework for automated task-oriented multi-turn dialogue generation at scale, utilizing an LRM-based simulator to dynamically generate high-value, domain-specific tools to solve specified tasks. However, we observe that a purely task-oriented design often results in "solely task-solving" trajectories, where the agent completes the objective with minimal interaction, failing to generate the high turn-count conversations seen in realistic scenarios. To bridge this gap, we shift toward a user-oriented simulation paradigm. By decoupling task generation from a dedicated user simulator that mimics human behavioral rules - such as incremental request-making and turn-by-turn feedback - we facilitate more authentic, extended multi-turn dialogues that reflect the iterative nature of real-world problem solving. Our generation pipeline operates as a versatile, plug-and-play module capable of initiating generation from any state, ensuring high scalability in producing extended tool-use data. Furthermore, by facilitating multiple task completions within a single trajectory, it yields a high-density dataset that reflects the multifaceted demands of real-world human-agent interaction.
PDF402January 15, 2026