ChatPaper.aiChatPaper

Технический отчет по Qwen3-Coder-Next

Qwen3-Coder-Next Technical Report

February 28, 2026
Авторы: Ruisheng Cao, Mouxiang Chen, Jiawei Chen, Zeyu Cui, Yunlong Feng, Binyuan Hui, Yuheng Jing, Kaixin Li, Mingze Li, Junyang Lin, Zeyao Ma, Kashun Shum, Xuwu Wang, Jinxi Wei, Jiaxi Yang, Jiajun Zhang, Lei Zhang, Zongmeng Zhang, Wenting Zhao, Fan Zhou
cs.AI

Аннотация

Мы представляем Qwen3-Coder-Next — модель с открытыми весами, специализированную для кодирующих агентов. Qwen3-Coder-Next представляет собой 80-миллиардную модель, которая активирует только 3 миллиарда параметров во время вывода, что обеспечивает высокую способность к программированию при эффективном выводе. В данной работе мы исследуем, насколько далеко могут продвинуть пределы возможностей моделей с малым числом параметров мощные рецепты обучения. Для достижения этой цели мы проводим агентное обучение посредством крупномасштабного синтеза верифицируемых задач по программированию в паре с исполняемыми средами, что позволяет обучаться непосредственно на основе обратной связи от среды через обучение в процессе и обучение с подкреплением. По результатам агентно-ориентированных бенчмарков, включая SWE-Bench и Terminal-Bench, Qwen3-Coder-Next демонстрирует конкурентоспособную производительность относительно количества активных параметров. Мы выпускаем обе версии с открытыми весами — базовую и настроенную на инструкции — для поддержки исследований и разработки реальных кодирующих агентов.
English
We present Qwen3-Coder-Next, an open-weight language model specialized for coding agents. Qwen3-Coder-Next is an 80-billion-parameter model that activates only 3 billion parameters during inference, enabling strong coding capability with efficient inference. In this work, we explore how far strong training recipes can push the capability limits of models with small parameter footprints. To achieve this, we perform agentic training through large-scale synthesis of verifiable coding tasks paired with executable environments, allowing learning directly from environment feedback via mid-training and reinforcement learning. Across agent-centric benchmarks including SWE-Bench and Terminal-Bench, Qwen3-Coder-Next achieves competitive performance relative to its active parameter count. We release both base and instruction-tuned open-weight versions to support research and real-world coding agent development.
PDF645May 8, 2026