ChatPaper.aiChatPaper

Qwen3-Coder-Next Technischer Bericht

Qwen3-Coder-Next Technical Report

February 28, 2026
Autoren: Ruisheng Cao, Mouxiang Chen, Jiawei Chen, Zeyu Cui, Yunlong Feng, Binyuan Hui, Yuheng Jing, Kaixin Li, Mingze Li, Junyang Lin, Zeyao Ma, Kashun Shum, Xuwu Wang, Jinxi Wei, Jiaxi Yang, Jiajun Zhang, Lei Zhang, Zongmeng Zhang, Wenting Zhao, Fan Zhou
cs.AI

Zusammenfassung

Wir stellen Qwen3-Coder-Next vor, ein Open-Weight-Sprachmodell, das speziell für Coding-Agenten entwickelt wurde. Qwen3-Coder-Next ist ein Modell mit 80 Milliarden Parametern, von dem während des Inferenzvorgangs nur 3 Milliarden Parameter aktiviert werden, was eine hohe Code-Fähigkeit bei effizienter Inferenz ermöglicht. In dieser Arbeit untersuchen wir, wie weit leistungsstarke Trainingsverfahren die Fähigkeitsgrenzen von Modellen mit kleinem Parameter-Footprint verschieben können. Dazu führen wir agentisches Training durch großskalige Synthese verifizierbarer Coding-Aufgaben in Kombination mit ausführbaren Umgebungen durch, was Lernen direkt aus Umgebungsfeedback mittels Mid-Training und Reinforcement Learning ermöglicht. In agentenzentrierten Benchmarks wie SWE-Bench und Terminal-Bench erzielt Qwen3-Coder-Next eine wettbewerbsfähige Leistung im Verhältnis zu seiner aktiven Parameteranzahl. Wir veröffentlichen sowohl Basis- als auch instruktionsfeinabgestimmte Open-Weight-Versionen, um die Forschung und die Entwicklung praktischer Coding-Agenten zu unterstützen.
English
We present Qwen3-Coder-Next, an open-weight language model specialized for coding agents. Qwen3-Coder-Next is an 80-billion-parameter model that activates only 3 billion parameters during inference, enabling strong coding capability with efficient inference. In this work, we explore how far strong training recipes can push the capability limits of models with small parameter footprints. To achieve this, we perform agentic training through large-scale synthesis of verifiable coding tasks paired with executable environments, allowing learning directly from environment feedback via mid-training and reinforcement learning. Across agent-centric benchmarks including SWE-Bench and Terminal-Bench, Qwen3-Coder-Next achieves competitive performance relative to its active parameter count. We release both base and instruction-tuned open-weight versions to support research and real-world coding agent development.
PDF645May 8, 2026