Протокол агентных данных: унификация наборов данных для разнообразной и эффективной тонкой настройки агентов больших языковых моделей
Agent Data Protocol: Unifying Datasets for Diverse, Effective Fine-tuning of LLM Agents
October 28, 2025
Авторы: Yueqi Song, Ketan Ramaneti, Zaid Sheikh, Ziru Chen, Boyu Gou, Tianbao Xie, Yiheng Xu, Danyang Zhang, Apurva Gandhi, Fan Yang, Joseph Liu, Tianyue Ou, Zhihao Yuan, Frank Xu, Shuyan Zhou, Xingyao Wang, Xiang Yue, Tao Yu, Huan Sun, Yu Su, Graham Neubig
cs.AI
Аннотация
Публичные результаты исследований по крупномасштабному контролируемому дообучению ИИ-агентов остаются относительно редкими, поскольку сбор данных для обучения агентов сопряжен с уникальными трудностями. В данной работе мы утверждаем, что основная проблема заключается не в отсутствии исходных источников данных, а в том, что огромное разнообразие данных фрагментировано между неоднородными форматами, инструментами и интерфейсами. Для решения этой задачи мы представляем протокол данных агентов (ADP) — облегченный язык представления, который служит «интерлингвой» между наборами данных агентов в различных форматах и унифицированными конвейерами обучения агентов на последующих этапах. Дизайн ADP достаточно выразителен, чтобы охватывать широкий спектр задач, включая использование API/инструментов, веб-навигацию, программирование, разработку программного обеспечения и общие агентские workflows, оставаясь при этом простым для анализа и обучения без необходимости инженерной доработки под каждый конкретный набор данных. В экспериментах мы объединили разнородную коллекцию из 13 существующих наборов данных для обучения агентов в формат ADP и преобразовали стандартизированные данные ADP в форматы, готовые к обучению, для нескольких агентских фреймворков. Мы провели контролируемое дообучение на этих данных и продемонстрировали средний прирост производительности примерно на 20% по сравнению с соответствующими базовыми моделями, а также достигли результатов уровня state-of-the-art или близких к ним на стандартных бенчмарках для программирования, веб-навигации, использования инструментов и исследовательских задач, без какой-либо предметно-ориентированной настройки. Весь код и данные публично выпущены в надежде, что ADP поможет снизить барьер для стандартизированного, масштабируемого и воспроизводимого обучения агентов.
English
Public research results on large-scale supervised finetuning of AI agents
remain relatively rare, since the collection of agent training data presents
unique challenges. In this work, we argue that the bottleneck is not a lack of
underlying data sources, but that a large variety of data is fragmented across
heterogeneous formats, tools, and interfaces. To this end, we introduce the
agent data protocol (ADP), a light-weight representation language that serves
as an "interlingua" between agent datasets in diverse formats and unified agent
training pipelines downstream. The design of ADP is expressive enough to
capture a large variety of tasks, including API/tool use, browsing, coding,
software engineering, and general agentic workflows, while remaining simple to
parse and train on without engineering at a per-dataset level. In experiments,
we unified a broad collection of 13 existing agent training datasets into ADP
format, and converted the standardized ADP data into training-ready formats for
multiple agent frameworks. We performed SFT on these data, and demonstrated an
average performance gain of ~20% over corresponding base models, and delivers
state-of-the-art or near-SOTA performance on standard coding, browsing, tool
use, and research benchmarks, without domain-specific tuning. All code and data
are released publicly, in the hope that ADP could help lower the barrier to
standardized, scalable, and reproducible agent training.