Nex-N1:大規模環境構築のための統一エコシステムによるエージェント型モデルの学習
Nex-N1: Agentic Models Trained via a Unified Ecosystem for Large-Scale Environment Construction
December 4, 2025
著者: Nex-AGI Team, Yuxuan Cai, Lu Chen, Qiaoling Chen, Yuyang Ding, Liwen Fan, Wenjie Fu, Yufei Gao, Honglin Guo, Pinxue Guo, Zhenhua Han, Zhengfu He, Hanglei Hu, Kai Hu, Shengjia Hua, Tianyu Huai, Baodai Huang, Li Ji, Zhen Jiang, Zhikai Lei, Bufan Li, Jiahang Lin, Lizhi Lin, Jinxiu Liu, Shichun Liu, Ziming Liu, Yuchen Ni, Pengfang Qian, Yujiong Shen, Qingyun Shi, Wentao Shu, Peng Sun, Yiran Suo, Tian Tang, Boyu Tian, Guoteng Wang, Junzhe Wang, Peixin Wang, Zhiheng Xi, Hang Yan, Jie Yang, Zhixiong Yang, Tianchu Yao, Guangze Ye, Qianxi Yu, Shuo Zhang, Xinyue Zhang, Yiqi Zhang, Jiarong Zhao, Miao Zheng, Rui Zheng, Enyu Zhou, Jiazheng Zhou, Maosen Zhou, Yuhao Zhou, Tao Gui, Yining Zheng, Xinchi Chen, Jie Zhou, Siyuan Feng, Qin Chen, Liang He, Qi Zhang, Xuanjing Huang, Xipeng Qiu
cs.AI
要旨
大規模言語モデル(LLM)が受動的な応答者から自律的なエージェントへと進化するにつれ、学習パラダイムは静的な模倣からインセンティブ駆動型の意思決定へと根本的な転換を迫られています。しかし、効果的な方策学習のための高品質なインタラクション信号を構築できるスケーラブルなインフラストラクチャの欠如が、この移行を大きく阻んでいます。この問題に対処するため、我々はインタラクティブ環境の多様性と複雑性を体系的に拡張する包括的手法を提案します。本手法は3つの直交する次元にアプローチすることでスケーリングを実現します:(1)複雑性:シンプルな設定で複雑なエージェント階層の構築を支援する柔軟なエージェントフレームワークNexAU、(2)多様性:自然言語から多様なエージェント階層を自動生成し無限の領域をカバーするNexA4A、(3)忠実度:動的な実世界環境を統合し接地された軌道合成を実現するNexGAPによるシミュレーションと現実のギャップの解消です。我々はこのインフラストラクチャ上に構築した多様で複雑なインタラクティブ環境を用いてNex-N1を学習させました。SWE-benchやtau2などのベンチマークにおける実験結果では、Nex-N1が複雑なエージェントタスクにおいて、常にSOTAのオープンソースモデルを上回り、最先端のプロプライエタリモデルに対しても遜色ない性能を発揮することが示されています。今後の研究の発展に向け、Nexエコシステムとモデル重みをオープンソースとして公開します。
English
The evolution of Large Language Models (LLMs) from passive responders to autonomous agents necessitates a fundamental shift in learning paradigms -- from static imitation to incentive-driven decision making. However, this transition is significantly impeded by the lack of scalable infrastructure capable of constructing high-quality interaction signals for effective policy learning. To address this, we introduce a comprehensive method designed to systematically scale the diversity and complexity of interactive environments. Our method realizes this scaling by addressing three orthogonal dimensions: (1) Complexity: NexAU, a flexible agent framework that supports building complex agent hierarchies via simple configurations; (2) Diversity: NexA4A automatically generates diverse agent hierarchies from natural language to cover infinite domains; and (3) Fidelity: NexGAP bridges the simulation-reality gap by integrating dynamic real-world environment for grounded trajectories synthesis. We train Nex-N1 upon the diverse and complex interactive environments established by our infrastructure. Empirical results on benchmarks such as SWE-bench and tau2 demonstrate that Nex-N1 consistently outperforms SOTA open-source models and achieves competitive performance against frontier proprietary models on complex agentic tasks. We open-source the Nex ecosystem and model weights to facilitate further research.