Relatório Técnico do Qwen3-Coder-Next
Qwen3-Coder-Next Technical Report
February 28, 2026
Autores: Ruisheng Cao, Mouxiang Chen, Jiawei Chen, Zeyu Cui, Yunlong Feng, Binyuan Hui, Yuheng Jing, Kaixin Li, Mingze Li, Junyang Lin, Zeyao Ma, Kashun Shum, Xuwu Wang, Jinxi Wei, Jiaxi Yang, Jiajun Zhang, Lei Zhang, Zongmeng Zhang, Wenting Zhao, Fan Zhou
cs.AI
Resumo
Apresentamos o Qwen3-Coder-Next, um modelo de linguagem de pesos abertos especializado para agentes de codificação. O Qwen3-Coder-Next é um modelo com 80 mil milhões de parâmetros que ativa apenas 3 mil milhões de parâmetros durante a inferência, permitindo uma forte capacidade de codificação com inferência eficiente. Neste trabalho, exploramos até que ponto receitas de treino robustas podem elevar os limites de capacidade de modelos com uma pegada reduzida de parâmetros. Para tal, realizamos um treino agentício através da síntese em larga escala de tarefas de codificação verificáveis emparelhadas com ambientes executáveis, permitindo a aprendizagem direta a partir do *feedback* do ambiente via *mid-training* e aprendizagem por reforço. Em *benchmarks* centrados em agentes, incluindo o SWE-Bench e o Terminal-Bench, o Qwen3-Coder-Next atinge um desempenho competitivo em relação à sua contagem de parâmetros ativos. Disponibilizamos versões de pesos abertos, tanto base como afinadas por instrução, para apoiar a investigação e o desenvolvimento de agentes de codificação no mundo real.
English
We present Qwen3-Coder-Next, an open-weight language model specialized for coding agents. Qwen3-Coder-Next is an 80-billion-parameter model that activates only 3 billion parameters during inference, enabling strong coding capability with efficient inference. In this work, we explore how far strong training recipes can push the capability limits of models with small parameter footprints. To achieve this, we perform agentic training through large-scale synthesis of verifiable coding tasks paired with executable environments, allowing learning directly from environment feedback via mid-training and reinforcement learning. Across agent-centric benchmarks including SWE-Bench and Terminal-Bench, Qwen3-Coder-Next achieves competitive performance relative to its active parameter count. We release both base and instruction-tuned open-weight versions to support research and real-world coding agent development.