ChatPaper.aiChatPaper

Protocolo de Dados para Agentes: Unificando Conjuntos de Dados para o Ajuste Fino Diversificado e Eficaz de Agentes de LLM

Agent Data Protocol: Unifying Datasets for Diverse, Effective Fine-tuning of LLM Agents

October 28, 2025
Autores: Yueqi Song, Ketan Ramaneti, Zaid Sheikh, Ziru Chen, Boyu Gou, Tianbao Xie, Yiheng Xu, Danyang Zhang, Apurva Gandhi, Fan Yang, Joseph Liu, Tianyue Ou, Zhihao Yuan, Frank Xu, Shuyan Zhou, Xingyao Wang, Xiang Yue, Tao Yu, Huan Sun, Yu Su, Graham Neubig
cs.AI

Resumo

Os resultados de pesquisa pública sobre o ajuste fino supervisionado em larga escala de agentes de IA permanecem relativamente escassos, uma vez que a coleta de dados para treinamento de agentes apresenta desafios únicos. Neste trabalho, argumentamos que o gargalo não é a falta de fontes de dados subjacentes, mas sim que uma grande variedade de dados está fragmentada em formatos, ferramentas e interfaces heterogêneas. Para tanto, introduzimos o protocolo de dados para agentes (ADP), uma linguagem de representação leve que serve como uma "interlíngua" entre conjuntos de dados de agentes em formatos diversos e pipelines unificados de treinamento de agentes a jusante. O design do ADP é suficientemente expressivo para capturar uma grande variedade de tarefas, incluindo uso de APIs/ferramentas, navegação, codificação, engenharia de software e fluxos de trabalho agenticos gerais, mantendo-se simples de analisar e treinar sem necessidade de engenharia em nível de conjunto de dados individual. Em experimentos, unificamos uma ampla coleção de 13 conjuntos de dados existentes para treinamento de agentes no formato ADP e convertemos os dados padronizados do ADP em formatos prontos para treinamento para múltiplas estruturas de agentes. Realizamos SFT nesses dados e demonstramos um ganho médio de desempenho de ~20% sobre os modelos base correspondentes, alcançando desempenho de ponta ou próximo ao estado da arte em benchmarks padrão de codificação, navegação, uso de ferramentas e pesquisa, sem ajustes específicos de domínio. Todo o código e dados são liberados publicamente, na expectativa de que o ADP possa ajudar a reduzir a barreira para o treinamento de agentes padronizado, escalável e reproduzível.
English
Public research results on large-scale supervised finetuning of AI agents remain relatively rare, since the collection of agent training data presents unique challenges. In this work, we argue that the bottleneck is not a lack of underlying data sources, but that a large variety of data is fragmented across heterogeneous formats, tools, and interfaces. To this end, we introduce the agent data protocol (ADP), a light-weight representation language that serves as an "interlingua" between agent datasets in diverse formats and unified agent training pipelines downstream. The design of ADP is expressive enough to capture a large variety of tasks, including API/tool use, browsing, coding, software engineering, and general agentic workflows, while remaining simple to parse and train on without engineering at a per-dataset level. In experiments, we unified a broad collection of 13 existing agent training datasets into ADP format, and converted the standardized ADP data into training-ready formats for multiple agent frameworks. We performed SFT on these data, and demonstrated an average performance gain of ~20% over corresponding base models, and delivers state-of-the-art or near-SOTA performance on standard coding, browsing, tool use, and research benchmarks, without domain-specific tuning. All code and data are released publicly, in the hope that ADP could help lower the barrier to standardized, scalable, and reproducible agent training.
PDF291February 7, 2026