ChatPaper.aiChatPaper

Protocolo de Datos de Agentes: Unificación de Conjuntos de Datos para el Ajuste Fino Diverso y Efectivo de Agentes de LLM

Agent Data Protocol: Unifying Datasets for Diverse, Effective Fine-tuning of LLM Agents

October 28, 2025
Autores: Yueqi Song, Ketan Ramaneti, Zaid Sheikh, Ziru Chen, Boyu Gou, Tianbao Xie, Yiheng Xu, Danyang Zhang, Apurva Gandhi, Fan Yang, Joseph Liu, Tianyue Ou, Zhihao Yuan, Frank Xu, Shuyan Zhou, Xingyao Wang, Xiang Yue, Tao Yu, Huan Sun, Yu Su, Graham Neubig
cs.AI

Resumen

Los resultados de investigación pública sobre el ajuste fino supervisado a gran escala de agentes de IA siguen siendo relativamente escasos, ya que la recopilación de datos para el entrenamiento de agentes presenta desafíos únicos. En este trabajo, sostenemos que el cuello de botella no es la falta de fuentes de datos subyacentes, sino que una gran variedad de datos está fragmentada en formatos, herramientas e interfaces heterogéneos. Con este fin, presentamos el protocolo de datos de agentes (ADP), un lenguaje de representación ligero que sirve como una "interlengua" entre conjuntos de datos de agentes en diversos formatos y las canalizaciones unificadas de entrenamiento de agentes posteriores. El diseño de ADP es lo suficientemente expresivo para capturar una gran variedad de tareas, incluyendo el uso de API/herramientas, navegación, programación, ingeniería de software y flujos de trabajo agenticos generales, mientras sigue siendo sencillo de analizar y entrenar sin necesidad de ingeniería a nivel de cada conjunto de datos. En los experimentos, unificamos una amplia colección de 13 conjuntos de datos de entrenamiento de agentes existentes en formato ADP, y convertimos los datos estandarizados de ADP en formatos listos para el entrenamiento para múltiples marcos de trabajo de agentes. Realizamos SFT con estos datos y demostramos una mejora promedio de rendimiento de ~20% sobre los modelos base correspondientes, logrando un rendimiento de vanguardia o cercano al estado del arte en puntos de referencia estándar de programación, navegación, uso de herramientas e investigación, sin ajustes específicos por dominio. Todo el código y los datos se han publicado públicamente, con la esperanza de que ADP pueda ayudar a reducir la barrera para un entrenamiento de agentes estandarizado, escalable y reproducible.
English
Public research results on large-scale supervised finetuning of AI agents remain relatively rare, since the collection of agent training data presents unique challenges. In this work, we argue that the bottleneck is not a lack of underlying data sources, but that a large variety of data is fragmented across heterogeneous formats, tools, and interfaces. To this end, we introduce the agent data protocol (ADP), a light-weight representation language that serves as an "interlingua" between agent datasets in diverse formats and unified agent training pipelines downstream. The design of ADP is expressive enough to capture a large variety of tasks, including API/tool use, browsing, coding, software engineering, and general agentic workflows, while remaining simple to parse and train on without engineering at a per-dataset level. In experiments, we unified a broad collection of 13 existing agent training datasets into ADP format, and converted the standardized ADP data into training-ready formats for multiple agent frameworks. We performed SFT on these data, and demonstrated an average performance gain of ~20% over corresponding base models, and delivers state-of-the-art or near-SOTA performance on standard coding, browsing, tool use, and research benchmarks, without domain-specific tuning. All code and data are released publicly, in the hope that ADP could help lower the barrier to standardized, scalable, and reproducible agent training.
PDF271December 1, 2025