Протокол агентных данных: унификация наборов данных для разнообразной и эффективной тонкой настройки агентов больших языковых моделей

Аннотация

Публичные результаты исследований по крупномасштабному контролируемому дообучению ИИ-агентов остаются относительно редкими, поскольку сбор данных для обучения агентов сопряжен с уникальными трудностями. В данной работе мы утверждаем, что основная проблема заключается не в отсутствии исходных источников данных, а в том, что огромное разнообразие данных фрагментировано между неоднородными форматами, инструментами и интерфейсами. Для решения этой задачи мы представляем протокол данных агентов (ADP) — облегченный язык представления, который служит «интерлингвой» между наборами данных агентов в различных форматах и унифицированными конвейерами обучения агентов на последующих этапах. Дизайн ADP достаточно выразителен, чтобы охватывать широкий спектр задач, включая использование API/инструментов, веб-навигацию, программирование, разработку программного обеспечения и общие агентские workflows, оставаясь при этом простым для анализа и обучения без необходимости инженерной доработки под каждый конкретный набор данных. В экспериментах мы объединили разнородную коллекцию из 13 существующих наборов данных для обучения агентов в формат ADP и преобразовали стандартизированные данные ADP в форматы, готовые к обучению, для нескольких агентских фреймворков. Мы провели контролируемое дообучение на этих данных и продемонстрировали средний прирост производительности примерно на 20% по сравнению с соответствующими базовыми моделями, а также достигли результатов уровня state-of-the-art или близких к ним на стандартных бенчмарках для программирования, веб-навигации, использования инструментов и исследовательских задач, без какой-либо предметно-ориентированной настройки. Весь код и данные публично выпущены в надежде, что ADP поможет снизить барьер для стандартизированного, масштабируемого и воспроизводимого обучения агентов.

English

Public research results on large-scale supervised finetuning of AI agents remain relatively rare, since the collection of agent training data presents unique challenges. In this work, we argue that the bottleneck is not a lack of underlying data sources, but that a large variety of data is fragmented across heterogeneous formats, tools, and interfaces. To this end, we introduce the agent data protocol (ADP), a light-weight representation language that serves as an "interlingua" between agent datasets in diverse formats and unified agent training pipelines downstream. The design of ADP is expressive enough to capture a large variety of tasks, including API/tool use, browsing, coding, software engineering, and general agentic workflows, while remaining simple to parse and train on without engineering at a per-dataset level. In experiments, we unified a broad collection of 13 existing agent training datasets into ADP format, and converted the standardized ADP data into training-ready formats for multiple agent frameworks. We performed SFT on these data, and demonstrated an average performance gain of ~20% over corresponding base models, and delivers state-of-the-art or near-SOTA performance on standard coding, browsing, tool use, and research benchmarks, without domain-specific tuning. All code and data are released publicly, in the hope that ADP could help lower the barrier to standardized, scalable, and reproducible agent training.

Протокол агентных данных: унификация наборов данных для разнообразной и эффективной тонкой настройки агентов больших языковых моделей

Agent Data Protocol: Unifying Datasets for Diverse, Effective Fine-tuning of LLM Agents

Аннотация

Support