Rapport Technique de Qwen3-Coder-Next
Qwen3-Coder-Next Technical Report
February 28, 2026
Auteurs: Ruisheng Cao, Mouxiang Chen, Jiawei Chen, Zeyu Cui, Yunlong Feng, Binyuan Hui, Yuheng Jing, Kaixin Li, Mingze Li, Junyang Lin, Zeyao Ma, Kashun Shum, Xuwu Wang, Jinxi Wei, Jiaxi Yang, Jiajun Zhang, Lei Zhang, Zongmeng Zhang, Wenting Zhao, Fan Zhou
cs.AI
Résumé
Nous présentons Qwen3-Coder-Next, un modèle de langage à poids ouvert spécialisé pour les agents de codage. Qwen3-Coder-Next est un modèle de 80 milliards de paramètres qui n'en active que 3 milliards lors de l'inférence, offrant ainsi de solides capacités de codage avec une inférence efficace. Dans ce travail, nous explorons jusqu'où des méthodes d'entraînement robustes peuvent repousser les limites des capacités des modèles ayant un faible nombre de paramètres actifs. Pour y parvenir, nous réalisons un entraînement agentique via la synthèse à grande échelle de tâches de codage vérifiables couplées à des environnements exécutables, permettant un apprentissage direct à partir des retours de l'environnement via un apprentissage par renforcement et un entraînement intermédiaire. Sur des benchmarks centrés sur les agents, notamment SWE-Bench et Terminal-Bench, Qwen3-Coder-Next obtient des performances compétitives par rapport à son nombre de paramètres actifs. Nous publions des versions à poids ouvert de base et optimisées par instruction pour soutenir la recherche et le développement d'agents de codage en conditions réelles.
English
We present Qwen3-Coder-Next, an open-weight language model specialized for coding agents. Qwen3-Coder-Next is an 80-billion-parameter model that activates only 3 billion parameters during inference, enabling strong coding capability with efficient inference. In this work, we explore how far strong training recipes can push the capability limits of models with small parameter footprints. To achieve this, we perform agentic training through large-scale synthesis of verifiable coding tasks paired with executable environments, allowing learning directly from environment feedback via mid-training and reinforcement learning. Across agent-centric benchmarks including SWE-Bench and Terminal-Bench, Qwen3-Coder-Next achieves competitive performance relative to its active parameter count. We release both base and instruction-tuned open-weight versions to support research and real-world coding agent development.