Nex-N1 : Modèles agentiques entraînés via un écosystème unifié pour la construction d'environnements à grande échelle
Nex-N1: Agentic Models Trained via a Unified Ecosystem for Large-Scale Environment Construction
December 4, 2025
papers.authors: Nex-AGI Team, Yuxuan Cai, Lu Chen, Qiaoling Chen, Yuyang Ding, Liwen Fan, Wenjie Fu, Yufei Gao, Honglin Guo, Pinxue Guo, Zhenhua Han, Zhengfu He, Hanglei Hu, Kai Hu, Shengjia Hua, Tianyu Huai, Baodai Huang, Li Ji, Zhen Jiang, Zhikai Lei, Bufan Li, Jiahang Lin, Lizhi Lin, Jinxiu Liu, Shichun Liu, Ziming Liu, Yuchen Ni, Pengfang Qian, Yujiong Shen, Qingyun Shi, Wentao Shu, Peng Sun, Yiran Suo, Tian Tang, Boyu Tian, Guoteng Wang, Junzhe Wang, Peixin Wang, Zhiheng Xi, Hang Yan, Jie Yang, Zhixiong Yang, Tianchu Yao, Guangze Ye, Qianxi Yu, Shuo Zhang, Xinyue Zhang, Yiqi Zhang, Jiarong Zhao, Miao Zheng, Rui Zheng, Enyu Zhou, Jiazheng Zhou, Maosen Zhou, Yuhao Zhou, Tao Gui, Yining Zheng, Xinchi Chen, Jie Zhou, Siyuan Feng, Qin Chen, Liang He, Qi Zhang, Xuanjing Huang, Xipeng Qiu
cs.AI
papers.abstract
L'évolution des modèles de langage de grande taille (LLM) d'outils de réponse passive vers des agents autonomes nécessite un changement fondamental de paradigme d'apprentissage — passant de l'imitation statique à la prise de décision guidée par des incitations. Cependant, cette transition est considérablement entravée par l'absence d'infrastructures évolutives capables de construire des signaux d'interaction de haute qualité pour un apprentissage efficace des politiques. Pour résoudre ce problème, nous introduisons une méthode complète conçue pour augmenter systématiquement la diversité et la complexité des environnements interactifs. Notre méthode réalise cette mise à l'échelle en abordant trois dimensions orthogonales : (1) Complexité : NexAU, un cadre d'agent flexible qui permet de construire des hiérarchies d'agents complexes via des configurations simples ; (2) Diversité : NexA4A génère automatiquement des hiérarchies d'agents diverses à partir du langage naturel pour couvrir des domaines infinis ; et (3) Fidélité : NexGAP comble le fossé simulation-réalité en intégrant un environnement dynamique du monde réel pour la synthèse de trajectoires ancrées. Nous avons entraîné Nex-N1 sur les environnements interactifs diversifiés et complexes établis par notre infrastructure. Les résultats empiriques sur des benchmarks tels que SWE-bench et tau2 démontrent que Nex-N1 surpasse constamment les modèles open-source de l'état de l'art et obtient des performances compétitives face aux modèles propriétaires de pointe sur des tâches agentielles complexes. Nous ouvrons en accès libre l'écosystème Nex et les poids du modèle pour faciliter les recherches ultérieures.
English
The evolution of Large Language Models (LLMs) from passive responders to autonomous agents necessitates a fundamental shift in learning paradigms -- from static imitation to incentive-driven decision making. However, this transition is significantly impeded by the lack of scalable infrastructure capable of constructing high-quality interaction signals for effective policy learning. To address this, we introduce a comprehensive method designed to systematically scale the diversity and complexity of interactive environments. Our method realizes this scaling by addressing three orthogonal dimensions: (1) Complexity: NexAU, a flexible agent framework that supports building complex agent hierarchies via simple configurations; (2) Diversity: NexA4A automatically generates diverse agent hierarchies from natural language to cover infinite domains; and (3) Fidelity: NexGAP bridges the simulation-reality gap by integrating dynamic real-world environment for grounded trajectories synthesis. We train Nex-N1 upon the diverse and complex interactive environments established by our infrastructure. Empirical results on benchmarks such as SWE-bench and tau2 demonstrate that Nex-N1 consistently outperforms SOTA open-source models and achieves competitive performance against frontier proprietary models on complex agentic tasks. We open-source the Nex ecosystem and model weights to facilitate further research.