ChatPaper.aiChatPaper

AgentFrontier: Ampliando la Frontera de Capacidades de Agentes LLM mediante Síntesis de Datos Guiada por ZPD

AgentFrontier: Expanding the Capability Frontier of LLM Agents with ZPD-Guided Data Synthesis

October 28, 2025
Autores: Xuanzhong Chen, Zile Qiao, Guoxin Chen, Liangcai Su, Zhen Zhang, Xinyu Wang, Pengjun Xie, Fei Huang, Jingren Zhou, Yong Jiang
cs.AI

Resumen

Entrenar agentes de modelos de lenguaje a gran escala en tareas situadas en la frontera de sus capacidades es clave para desbloquear un razonamiento avanzado. Presentamos un enfoque de síntesis de datos inspirado en la teoría educativa de la Zona de Desarrollo Próximo (ZDP), que define esta frontera como tareas que un LLM no puede resolver por sí solo pero puede dominar con orientación. Para operacionalizar esto, presentamos el Motor AgentFrontier, una canalización automatizada que sintetiza datos multidisciplinarios de alta calidad situados precisamente dentro de la ZDP del LLM. Este motor admite tanto el pre-entrenamiento continuo con datos intensivos en conocimiento como el post-entrenamiento específico en tareas de razonamiento complejo. Del mismo marco, derivamos el Examen ZPD, un punto de referencia dinámico y automatizado diseñado para evaluar las capacidades de los agentes en estas tareas fronterizas. Entrenamos el modelo AgentFrontier-30B-A3B con nuestros datos sintetizados, que logra resultados de vanguardia en puntos de referencia exigentes como el Examen Final de la Humanidad, superando incluso a algunos agentes propietarios líderes. Nuestro trabajo demuestra que un enfoque de síntesis de datos guiado por la ZDP ofrece un camino escalable y efectivo para construir agentes de LLM más capaces.
English
Training large language model agents on tasks at the frontier of their capabilities is key to unlocking advanced reasoning. We introduce a data synthesis approach inspired by the educational theory of the Zone of Proximal Development (ZPD), which defines this frontier as tasks an LLM cannot solve alone but can master with guidance. To operationalize this, we present the AgentFrontier Engine, an automated pipeline that synthesizes high-quality, multidisciplinary data situated precisely within the LLM's ZPD. This engine supports both continued pre-training with knowledge-intensive data and targeted post-training on complex reasoning tasks. From the same framework, we derive the ZPD Exam, a dynamic and automated benchmark designed to evaluate agent capabilities on these frontier tasks. We train AgentFrontier-30B-A3B model on our synthesized data, which achieves state-of-the-art results on demanding benchmarks like Humanity's Last Exam, even surpassing some leading proprietary agents. Our work demonstrates that a ZPD-guided approach to data synthesis offers a scalable and effective path toward building more capable LLM agents.
PDF222December 1, 2025