Relatório Técnico do Qwen3-Coder-Next

Resumo

Apresentamos o Qwen3-Coder-Next, um modelo de linguagem de pesos abertos especializado para agentes de codificação. O Qwen3-Coder-Next é um modelo com 80 mil milhões de parâmetros que ativa apenas 3 mil milhões de parâmetros durante a inferência, permitindo uma forte capacidade de codificação com inferência eficiente. Neste trabalho, exploramos até que ponto receitas de treino robustas podem elevar os limites de capacidade de modelos com uma pegada reduzida de parâmetros. Para tal, realizamos um treino agentício através da síntese em larga escala de tarefas de codificação verificáveis emparelhadas com ambientes executáveis, permitindo a aprendizagem direta a partir do *feedback* do ambiente via *mid-training* e aprendizagem por reforço. Em *benchmarks* centrados em agentes, incluindo o SWE-Bench e o Terminal-Bench, o Qwen3-Coder-Next atinge um desempenho competitivo em relação à sua contagem de parâmetros ativos. Disponibilizamos versões de pesos abertos, tanto base como afinadas por instrução, para apoiar a investigação e o desenvolvimento de agentes de codificação no mundo real.

English

We present Qwen3-Coder-Next, an open-weight language model specialized for coding agents. Qwen3-Coder-Next is an 80-billion-parameter model that activates only 3 billion parameters during inference, enabling strong coding capability with efficient inference. In this work, we explore how far strong training recipes can push the capability limits of models with small parameter footprints. To achieve this, we perform agentic training through large-scale synthesis of verifiable coding tasks paired with executable environments, allowing learning directly from environment feedback via mid-training and reinforcement learning. Across agent-centric benchmarks including SWE-Bench and Terminal-Bench, Qwen3-Coder-Next achieves competitive performance relative to its active parameter count. We release both base and instruction-tuned open-weight versions to support research and real-world coding agent development.