ChatPaper.aiChatPaper

Generación de Diálogos Multiturno Orientada al Usuario con Uso de Herramientas a Gran Escala

User-Oriented Multi-Turn Dialogue Generation with Tool Use at scale

January 13, 2026
Autores: Jungho Cho, Minbyul Jeong, Sungrae Park
cs.AI

Resumen

El reciente cambio de paradigma hacia los modelos de razonamiento a gran escala (LRM) como agentes autónomos ha intensificado la demanda de capacidades sofisticadas de uso de herramientas en conversaciones de múltiples turnos. Sin embargo, los conjuntos de datos y los enfoques de generación de datos existentes están limitados por conjuntos de herramientas predefinidos y estáticos que no pueden escalar a la complejidad de la colaboración abierta entre humanos y agentes. Para abordar esto, inicialmente desarrollamos un marco para la generación automatizada a gran escala de diálogos multiturno orientados a tareas, utilizando un simulador basado en LRM para generar dinámicamente herramientas de alto valor y específicas del dominio para resolver tareas especificadas. No obstante, observamos que un diseño puramente orientado a tareas a menudo resulta en trayectorias de "solo resolución de tareas", donde el agente completa el objetivo con una interacción mínima, sin generar las conversaciones de alto número de turnos observadas en escenarios realistas. Para cerrar esta brecha, nos orientamos hacia un paradigma de simulación centrado en el usuario. Al desacoplar la generación de tareas de un simulador de usuario dedicado que imita reglas de comportamiento humano —como la realización incremental de peticiones y la retroalimentación turno por turno— facilitamos diálogos multiturno más auténticos y extendidos que reflejan la naturaleza iterativa de la resolución de problemas del mundo real. Nuestra canalización de generación opera como un módulo versátil y listo para usar capaz de iniciar la generación desde cualquier estado, garantizando una alta escalabilidad en la producción de datos extendidos de uso de herramientas. Además, al facilitar múltiples finalizaciones de tareas dentro de una única trayectoria, produce un conjunto de datos de alta densidad que refleja las demandas multifacéticas de la interacción real entre humanos y agentes.
English
The recent paradigm shift toward large reasoning models (LRMs) as autonomous agents has intensified the demand for sophisticated, multi-turn tool-use capabilities. Yet, existing datasets and data-generation approaches are limited by static, predefined toolsets that cannot scale to the complexity of open-ended human-agent collaboration. To address this, we initially developed a framework for automated task-oriented multi-turn dialogue generation at scale, utilizing an LRM-based simulator to dynamically generate high-value, domain-specific tools to solve specified tasks. However, we observe that a purely task-oriented design often results in "solely task-solving" trajectories, where the agent completes the objective with minimal interaction, failing to generate the high turn-count conversations seen in realistic scenarios. To bridge this gap, we shift toward a user-oriented simulation paradigm. By decoupling task generation from a dedicated user simulator that mimics human behavioral rules - such as incremental request-making and turn-by-turn feedback - we facilitate more authentic, extended multi-turn dialogues that reflect the iterative nature of real-world problem solving. Our generation pipeline operates as a versatile, plug-and-play module capable of initiating generation from any state, ensuring high scalability in producing extended tool-use data. Furthermore, by facilitating multiple task completions within a single trajectory, it yields a high-density dataset that reflects the multifaceted demands of real-world human-agent interaction.
PDF402January 15, 2026