Nex-N1: Modelli Agenti Addestrati tramite un Ecosystem Unificato per la Costruzione di Ambienti su Larga Scala
Nex-N1: Agentic Models Trained via a Unified Ecosystem for Large-Scale Environment Construction
December 4, 2025
Autori: Nex-AGI Team, Yuxuan Cai, Lu Chen, Qiaoling Chen, Yuyang Ding, Liwen Fan, Wenjie Fu, Yufei Gao, Honglin Guo, Pinxue Guo, Zhenhua Han, Zhengfu He, Hanglei Hu, Kai Hu, Shengjia Hua, Tianyu Huai, Baodai Huang, Li Ji, Zhen Jiang, Zhikai Lei, Bufan Li, Jiahang Lin, Lizhi Lin, Jinxiu Liu, Shichun Liu, Ziming Liu, Yuchen Ni, Pengfang Qian, Yujiong Shen, Qingyun Shi, Wentao Shu, Peng Sun, Yiran Suo, Tian Tang, Boyu Tian, Guoteng Wang, Junzhe Wang, Peixin Wang, Zhiheng Xi, Hang Yan, Jie Yang, Zhixiong Yang, Tianchu Yao, Guangze Ye, Qianxi Yu, Shuo Zhang, Xinyue Zhang, Yiqi Zhang, Jiarong Zhao, Miao Zheng, Rui Zheng, Enyu Zhou, Jiazheng Zhou, Maosen Zhou, Yuhao Zhou, Tao Gui, Yining Zheng, Xinchi Chen, Jie Zhou, Siyuan Feng, Qin Chen, Liang He, Qi Zhang, Xuanjing Huang, Xipeng Qiu
cs.AI
Abstract
L'evoluzione dei Large Language Model (LLM) da risponditori passivi ad agenti autonomi richiede un cambiamento fondamentale nei paradigmi di apprendimento, dall'imitazione statica al processo decisionale guidato da incentivi. Tuttavia, questa transizione è fortemente ostacolata dalla mancanza di un'infrastruttura scalabile in grado di costruire segnali di interazione di alta qualità per un apprendimento efficace delle policy.
Per affrontare questa sfida, introduciamo un metodo completo progettato per scalare sistematicamente la diversità e la complessità degli ambienti interattivi. Il nostro metodo realizza questa scalabilità affrontando tre dimensioni ortogonali: (1) **Complessità**: NexAU, un framework agente flessibile che supporta la costruzione di gerarchie di agenti complesse tramite semplici configurazioni; (2) **Diversità**: NexA4A genera automaticamente gerarchie di agenti diverse a partire dal linguaggio naturale per coprire domini infiniti; e (3) **Fedeltà**: NexGAP colma il divario simulazione-realtà integrando un ambiente dinamico del mondo reale per la sintesi di traiettorie grounded.
Addestriamo Nex-N1 sugli ambienti interattivi diversificati e complessi stabiliti dalla nostra infrastruttura. I risultati empirici su benchmark come SWE-bench e tau2 dimostrano che Nex-N1 supera costantemente i modelli open-source all'avanguardia (SOTA) e raggiunge prestazioni competitive rispetto ai modelli proprietari di frontiera in compiti agentici complessi. Rendiamo open-source l'ecosistema Nex e i pesi del modello per facilitare ulteriori ricerche.
English
The evolution of Large Language Models (LLMs) from passive responders to autonomous agents necessitates a fundamental shift in learning paradigms -- from static imitation to incentive-driven decision making. However, this transition is significantly impeded by the lack of scalable infrastructure capable of constructing high-quality interaction signals for effective policy learning. To address this, we introduce a comprehensive method designed to systematically scale the diversity and complexity of interactive environments. Our method realizes this scaling by addressing three orthogonal dimensions: (1) Complexity: NexAU, a flexible agent framework that supports building complex agent hierarchies via simple configurations; (2) Diversity: NexA4A automatically generates diverse agent hierarchies from natural language to cover infinite domains; and (3) Fidelity: NexGAP bridges the simulation-reality gap by integrating dynamic real-world environment for grounded trajectories synthesis. We train Nex-N1 upon the diverse and complex interactive environments established by our infrastructure. Empirical results on benchmarks such as SWE-bench and tau2 demonstrate that Nex-N1 consistently outperforms SOTA open-source models and achieves competitive performance against frontier proprietary models on complex agentic tasks. We open-source the Nex ecosystem and model weights to facilitate further research.