ChatPaper.aiChatPaper

Протокол агентных данных: унификация наборов данных для разнообразной и эффективной тонкой настройки агентов больших языковых моделей

Agent Data Protocol: Unifying Datasets for Diverse, Effective Fine-tuning of LLM Agents

October 28, 2025
Авторы: Yueqi Song, Ketan Ramaneti, Zaid Sheikh, Ziru Chen, Boyu Gou, Tianbao Xie, Yiheng Xu, Danyang Zhang, Apurva Gandhi, Fan Yang, Joseph Liu, Tianyue Ou, Zhihao Yuan, Frank Xu, Shuyan Zhou, Xingyao Wang, Xiang Yue, Tao Yu, Huan Sun, Yu Su, Graham Neubig
cs.AI

Аннотация

Публичные результаты исследований по крупномасштабному контролируемому дообучению ИИ-агентов остаются относительно редкими, поскольку сбор данных для обучения агентов сопряжен с уникальными трудностями. В данной работе мы утверждаем, что основная проблема заключается не в отсутствии исходных источников данных, а в том, что огромное разнообразие данных фрагментировано между неоднородными форматами, инструментами и интерфейсами. Для решения этой задачи мы представляем протокол данных агентов (ADP) — облегченный язык представления, который служит «интерлингвой» между наборами данных агентов в различных форматах и унифицированными конвейерами обучения агентов на последующих этапах. Дизайн ADP достаточно выразителен, чтобы охватывать широкий спектр задач, включая использование API/инструментов, веб-навигацию, программирование, разработку программного обеспечения и общие агентские workflows, оставаясь при этом простым для анализа и обучения без необходимости инженерной доработки под каждый конкретный набор данных. В экспериментах мы объединили разнородную коллекцию из 13 существующих наборов данных для обучения агентов в формат ADP и преобразовали стандартизированные данные ADP в форматы, готовые к обучению, для нескольких агентских фреймворков. Мы провели контролируемое дообучение на этих данных и продемонстрировали средний прирост производительности примерно на 20% по сравнению с соответствующими базовыми моделями, а также достигли результатов уровня state-of-the-art или близких к ним на стандартных бенчмарках для программирования, веб-навигации, использования инструментов и исследовательских задач, без какой-либо предметно-ориентированной настройки. Весь код и данные публично выпущены в надежде, что ADP поможет снизить барьер для стандартизированного, масштабируемого и воспроизводимого обучения агентов.
English
Public research results on large-scale supervised finetuning of AI agents remain relatively rare, since the collection of agent training data presents unique challenges. In this work, we argue that the bottleneck is not a lack of underlying data sources, but that a large variety of data is fragmented across heterogeneous formats, tools, and interfaces. To this end, we introduce the agent data protocol (ADP), a light-weight representation language that serves as an "interlingua" between agent datasets in diverse formats and unified agent training pipelines downstream. The design of ADP is expressive enough to capture a large variety of tasks, including API/tool use, browsing, coding, software engineering, and general agentic workflows, while remaining simple to parse and train on without engineering at a per-dataset level. In experiments, we unified a broad collection of 13 existing agent training datasets into ADP format, and converted the standardized ADP data into training-ready formats for multiple agent frameworks. We performed SFT on these data, and demonstrated an average performance gain of ~20% over corresponding base models, and delivers state-of-the-art or near-SOTA performance on standard coding, browsing, tool use, and research benchmarks, without domain-specific tuning. All code and data are released publicly, in the hope that ADP could help lower the barrier to standardized, scalable, and reproducible agent training.
PDF271December 1, 2025