ChatPaper.aiChatPaper

AgentFrontier: ZPDガイドによるデータ合成によるLLMエージェントの能力フロンティアの拡張

AgentFrontier: Expanding the Capability Frontier of LLM Agents with ZPD-Guided Data Synthesis

October 28, 2025
著者: Xuanzhong Chen, Zile Qiao, Guoxin Chen, Liangcai Su, Zhen Zhang, Xinyu Wang, Pengjun Xie, Fei Huang, Jingren Zhou, Yong Jiang
cs.AI

要旨

大規模言語モデルエージェントを、その能力限界に位置するタスクで訓練することは、高度な推論能力を解き放つ鍵である。本論文では、教育的理論である「発達の最近接領域(ZPD)」に着想を得たデータ合成手法を提案する。ZPDとは、LLMが単独では解決できないが、指導を受ければ習得可能なタスクの領域として定義される。これを具体化するため、LLMのZPD内に正確に位置する高品質で学際的なデータを自動生成するパイプライン「AgentFrontier Engine」を開発した。このエンジンは、知識集約型データを用いた継続事前学習と、複雑な推論タスクに対する事後学習の両方を支援する。同一のフレームワークから、これらの最先端タスクにおけるエージェント能力を評価するために設計された動的かつ自動化されたベンチマーク「ZPD Exam」も導出した。合成データで訓練したAgentFrontier-30B-A3Bモデルは、Humanity's Last Examといった難易度の高いベンチマークでState-of-the-Artを達成し、一部の主要なプロプライエタリエージェントを凌駕する結果を示した。本研究は、ZPDに導かれたデータ合成アプローチが、より高能力なLLMエージェント構築へのスケーラブルで効果的な道筋を提供することを実証する。
English
Training large language model agents on tasks at the frontier of their capabilities is key to unlocking advanced reasoning. We introduce a data synthesis approach inspired by the educational theory of the Zone of Proximal Development (ZPD), which defines this frontier as tasks an LLM cannot solve alone but can master with guidance. To operationalize this, we present the AgentFrontier Engine, an automated pipeline that synthesizes high-quality, multidisciplinary data situated precisely within the LLM's ZPD. This engine supports both continued pre-training with knowledge-intensive data and targeted post-training on complex reasoning tasks. From the same framework, we derive the ZPD Exam, a dynamic and automated benchmark designed to evaluate agent capabilities on these frontier tasks. We train AgentFrontier-30B-A3B model on our synthesized data, which achieves state-of-the-art results on demanding benchmarks like Humanity's Last Exam, even surpassing some leading proprietary agents. Our work demonstrates that a ZPD-guided approach to data synthesis offers a scalable and effective path toward building more capable LLM agents.
PDF222December 1, 2025