ChatPaper.aiChatPaper

Nex-N1: 대규모 환경 구축을 위한 통합 생태계를 통해 훈련된 에이전트 모델

Nex-N1: Agentic Models Trained via a Unified Ecosystem for Large-Scale Environment Construction

December 4, 2025
저자: Nex-AGI Team, Yuxuan Cai, Lu Chen, Qiaoling Chen, Yuyang Ding, Liwen Fan, Wenjie Fu, Yufei Gao, Honglin Guo, Pinxue Guo, Zhenhua Han, Zhengfu He, Hanglei Hu, Kai Hu, Shengjia Hua, Tianyu Huai, Baodai Huang, Li Ji, Zhen Jiang, Zhikai Lei, Bufan Li, Jiahang Lin, Lizhi Lin, Jinxiu Liu, Shichun Liu, Ziming Liu, Yuchen Ni, Pengfang Qian, Yujiong Shen, Qingyun Shi, Wentao Shu, Peng Sun, Yiran Suo, Tian Tang, Boyu Tian, Guoteng Wang, Junzhe Wang, Peixin Wang, Zhiheng Xi, Hang Yan, Jie Yang, Zhixiong Yang, Tianchu Yao, Guangze Ye, Qianxi Yu, Shuo Zhang, Xinyue Zhang, Yiqi Zhang, Jiarong Zhao, Miao Zheng, Rui Zheng, Enyu Zhou, Jiazheng Zhou, Maosen Zhou, Yuhao Zhou, Tao Gui, Yining Zheng, Xinchi Chen, Jie Zhou, Siyuan Feng, Qin Chen, Liang He, Qi Zhang, Xuanjing Huang, Xipeng Qiu
cs.AI

초록

대규모 언어 모델(LLM)이 수동적 응답자에서 자율적 에이전트로 진화함에 따라 학습 패러다임은 정적 모방에서 인센티브 기반 의사 결정으로 근본적인 전환이 필요합니다. 그러나 이러한 전환은 효과적인 정책 학습을 위한 고품질 상호작용 신호를 구축할 수 있는 확장 가능한 인프라의 부재로 인해 크게 저해되고 있습니다. 이를 해결하기 위해 본 연구는 상호작용 환경의 다양성과 복잡성을 체계적으로 확장하도록 설계된 포괄적인 방법을 소개합니다. 우리의 방법은 세 가지 직교 차원을 해결함으로써 이러한 확장을 실현합니다: (1) 복잡성: 간단한 설정을 통해 복잡한 에이전트 계층 구조 구축을 지원하는 유연한 에이전트 프레임워크인 NexAU; (2) 다양성: 자연어에서 다양한 에이전트 계층 구조를 자동 생성하여 무한한 도메인을 포괄하는 NexA4A; (3) 정확도: 동적 실세계 환경을 통합하여 근거 트랙젝토리 합성을 위한 시뮬레이션-현실 간격을 해소하는 NexGAP. 우리는 본 인프라를 통해 구축된 다양하고 복잡한 상호작용 환경 기반으로 Nex-N1을 학습시켰습니다. SWE-bench 및 tau2와 같은 벤치마크에 대한 실험 결과, Nex-N1은 복잡한 에이전트 작업에서 SOTA 오픈소스 모델들을 꾸준히 능가하고 최첨단 독점 모델들과 경쟁력 있는 성능을 달성함을 보여줍니다. 우리는 Nex 생태계와 모델 가중치를 오픈소스로 공개하여 향후 연구를 촉진하고자 합니다.
English
The evolution of Large Language Models (LLMs) from passive responders to autonomous agents necessitates a fundamental shift in learning paradigms -- from static imitation to incentive-driven decision making. However, this transition is significantly impeded by the lack of scalable infrastructure capable of constructing high-quality interaction signals for effective policy learning. To address this, we introduce a comprehensive method designed to systematically scale the diversity and complexity of interactive environments. Our method realizes this scaling by addressing three orthogonal dimensions: (1) Complexity: NexAU, a flexible agent framework that supports building complex agent hierarchies via simple configurations; (2) Diversity: NexA4A automatically generates diverse agent hierarchies from natural language to cover infinite domains; and (3) Fidelity: NexGAP bridges the simulation-reality gap by integrating dynamic real-world environment for grounded trajectories synthesis. We train Nex-N1 upon the diverse and complex interactive environments established by our infrastructure. Empirical results on benchmarks such as SWE-bench and tau2 demonstrate that Nex-N1 consistently outperforms SOTA open-source models and achieves competitive performance against frontier proprietary models on complex agentic tasks. We open-source the Nex ecosystem and model weights to facilitate further research.
PDF571December 6, 2025