AgentFrontier: Het Uitbreiden van de Mogelijkheidsgrens van LLM-Agents met ZGD-Gestuurde Datasynthese
AgentFrontier: Expanding the Capability Frontier of LLM Agents with ZPD-Guided Data Synthesis
October 28, 2025
Auteurs: Xuanzhong Chen, Zile Qiao, Guoxin Chen, Liangcai Su, Zhen Zhang, Xinyu Wang, Pengjun Xie, Fei Huang, Jingren Zhou, Yong Jiang
cs.AI
Samenvatting
Het trainen van grote taalmodelagenten op taken aan de grenzen van hun
mogelijkheden is essentieel voor het ontgrendelen van geavanceerd redeneervermogen. Wij introduceren een
datasynthesemethode geïnspireerd op de onderwijstheorie van de Zone van de Naastbije Ontwikkeling (ZNO),
die deze grens definieert als taken die een LLM niet alleen kan oplossen, maar wel kan beheersen met
begeleiding. Om dit te operationaliseren, presenteren we de AgentFrontier Engine, een geautomatiseerde
pijplijn die hoogwaardige, multidisciplinaire data synthetiseert die zich precies binnen de ZNO van het LLM
bevindt. Deze engine ondersteunt zowel voortgezotte pre-training met kennisintensieve data als gerichte
post-training op complexe redeneertaken. Vanuit hetzelfde framework leiden we de ZNO-examens af, een
dynamische en geautomatiseerde benchmark ontworpen om agentcapaciteiten op deze grensverleggende
taken te evalueren. We trainen het AgentFrontier-30B-A3B-model op onze gesynthetiseerde data, dat
state-of-the-art resultaten behaalt op veeleisende benchmarks zoals Humanity's Last Exam, en zelfs enkele
toonaangevende propriëtaire agenten overtreft. Ons werk toont aan dat een ZNO-gestuurde aanpak voor
datasynthese een schaalbare en effectieve weg biedt voor het bouwen van capabelere LLM-agenten.
English
Training large language model agents on tasks at the frontier of their
capabilities is key to unlocking advanced reasoning. We introduce a data
synthesis approach inspired by the educational theory of the Zone of Proximal
Development (ZPD), which defines this frontier as tasks an LLM cannot solve
alone but can master with guidance. To operationalize this, we present the
AgentFrontier Engine, an automated pipeline that synthesizes high-quality,
multidisciplinary data situated precisely within the LLM's ZPD. This engine
supports both continued pre-training with knowledge-intensive data and targeted
post-training on complex reasoning tasks. From the same framework, we derive
the ZPD Exam, a dynamic and automated benchmark designed to evaluate agent
capabilities on these frontier tasks. We train AgentFrontier-30B-A3B model on
our synthesized data, which achieves state-of-the-art results on demanding
benchmarks like Humanity's Last Exam, even surpassing some leading proprietary
agents. Our work demonstrates that a ZPD-guided approach to data synthesis
offers a scalable and effective path toward building more capable LLM agents.