ChatPaper.aiChatPaper

Многопроходная генерация диалогов, ориентированная на пользователя, с использованием инструментов в масштабе

User-Oriented Multi-Turn Dialogue Generation with Tool Use at scale

January 13, 2026
Авторы: Jungho Cho, Minbyul Jeong, Sungrae Park
cs.AI

Аннотация

Недавний парадигмальный сдвиг в сторону больших моделей рассуждений (LRM) как автономных агентов усилил потребность в sophisticated, многоходовых возможностях использования инструментов. Однако существующие наборы данных и подходы к их генерации ограничены статическими, предопределенными наборами инструментов, которые не масштабируются до сложности открытого взаимодействия человека и агента. Чтобы решить эту проблему, мы изначально разработали фреймворк для автоматизированной генерации масштабируемых целеориентированных многократных диалогов, используя симулятор на основе LRM для динамического создания высокоценных, предметно-ориентированных инструментов решения поставленных задач. Однако мы наблюдаем, что чисто целеориентированный дизайн часто приводит к траекториям «исключительно решения задач», где агент достигает цели с минимальным взаимодействием, не генерируя многоходовые беседы, характерные для реальных сценариев. Чтобы устранить этот разрыв, мы переходим к пользователь-ориентированной парадигме симуляции. Разделяя генерацию задач и специализированный симулятор пользователя, имитирующий поведенческие правила человека — такие как инкрементное формулирование запросов и пошаговая обратная связь — мы способствуем созданию более аутентичных, продолжительных многократных диалогов, отражающих итеративную природу решения проблем в реальном мире. Наш конвейер генерации функционирует как универсальный модуль plug-and-play, способный инициировать генерацию из любого состояния, обеспечивая высокую масштабируемость при создании обширных данных по использованию инструментов. Более того, позволяя выполнять несколько задач в рамках одной траектории, он производит высокоплотный набор данных, отражающий многогранные требования реального взаимодействия человека и агента.
English
The recent paradigm shift toward large reasoning models (LRMs) as autonomous agents has intensified the demand for sophisticated, multi-turn tool-use capabilities. Yet, existing datasets and data-generation approaches are limited by static, predefined toolsets that cannot scale to the complexity of open-ended human-agent collaboration. To address this, we initially developed a framework for automated task-oriented multi-turn dialogue generation at scale, utilizing an LRM-based simulator to dynamically generate high-value, domain-specific tools to solve specified tasks. However, we observe that a purely task-oriented design often results in "solely task-solving" trajectories, where the agent completes the objective with minimal interaction, failing to generate the high turn-count conversations seen in realistic scenarios. To bridge this gap, we shift toward a user-oriented simulation paradigm. By decoupling task generation from a dedicated user simulator that mimics human behavioral rules - such as incremental request-making and turn-by-turn feedback - we facilitate more authentic, extended multi-turn dialogues that reflect the iterative nature of real-world problem solving. Our generation pipeline operates as a versatile, plug-and-play module capable of initiating generation from any state, ensuring high scalability in producing extended tool-use data. Furthermore, by facilitating multiple task completions within a single trajectory, it yields a high-density dataset that reflects the multifaceted demands of real-world human-agent interaction.
PDF402January 15, 2026