ChatPaper.aiChatPaper

Технический отчет IQuest-Coder-V1

IQuest-Coder-V1 Technical Report

March 17, 2026
Авторы: Jian Yang, Wei Zhang, Shawn Guo, Zhengmao Ye, Lin Jing, Shark Liu, Yizhi Li, Jiajun Wu, Cening Liu, X. Ma, Yuyang Song, Siwei Wu, Yuwen Li, L. Liao, T. Zheng, Ziling Huang, Zelong Huang, Che Liu, Yan Xing, Renyuan Li, Qingsong Cai, Hanxu Yan, Siyue Wang, Shikai Li, Jason Klein Liu, An Huang, Yongsheng Kang, Jinxing Zhang, Chuan Hao, Haowen Wang, Weicheng Gu, Ran Tao, Mingjie Tang, Peihao Wu, Jianzhou Wang, Xianglong Liu, Weifeng Lv, Bryan Dai
cs.AI

Аннотация

В данном отчете мы представляем серию моделей IQuest-Coder-V1 (7B/14B/40B/40B-Loop) — новое семейство больших языковых моделей для работы с кодом. Выходя за рамки статических представлений кода, мы предлагаем парадигму многоэтапного обучения на основе потока кода, которая отражает динамическую эволюцию программной логики на различных этапах конвейера. Наши модели разработаны по эволюционному конвейеру, начиная с начального предварительного обучения на данных, включающих факты о коде, репозитории и завершение кода. После этого мы реализуем специализированный этап промежуточного обучения, который интегрирует траектории рассуждений и агентского поведения в контексте 32k, а также работу с репозиторным масштабом в контексте 128k, чтобы заложить глубокие логические основы. Затем модели завершаются пост-обучением специализированных возможностей кодирования, которое разделяется на два специализированных направления: путь мышления (с использованием обучения с подкреплением, управляемого рассуждениями) и путь инструкций (оптимизированный для общей помощи). IQuest-Coder-V1 демонстрирует наилучшую производительность среди конкурирующих моделей по ключевым направлениям интеллектуальной работы с кодом: агентской software-инженерии, соревновательному программированию и сложному использованию инструментов. Для решения ограничений развертывания вариант IQuest-Coder-V1-Loop представляет рекуррентный механизм, предназначенный для оптимизации баланса между емкостью модели и требованиями к развертыванию, предлагая архитектурно улучшенный путь для компромисса между эффективностью и производительностью. Мы уверены, что выпуск серии IQuest-Coder-V1, включая полную прозрачную цепочку контрольных точек от баз предварительного обучения до финальных моделей мышления и инструкций, будет способствовать прогрессу в исследованиях автономного интеллекта для работы с кодом и реальных агентских систем.
English
In this report, we introduce the IQuest-Coder-V1 series-(7B/14B/40B/40B-Loop), a new family of code large language models (LLMs). Moving beyond static code representations, we propose the code-flow multi-stage training paradigm, which captures the dynamic evolution of software logic through different phases of the pipeline. Our models are developed through the evolutionary pipeline, starting with the initial pre-training consisting of code facts, repository, and completion data. Following that, we implement a specialized mid-training stage that integrates reasoning and agentic trajectories in 32k-context and repository-scale in 128k-context to forge deep logical foundations. The models are then finalized with post-training of specialized coding capabilities, which is bifurcated into two specialized paths: the thinking path (utilizing reasoning-driven RL) and the instruct path (optimized for general assistance). IQuest-Coder-V1 achieves state-of-the-art performance among competitive models across critical dimensions of code intelligence: agentic software engineering, competitive programming, and complex tool use. To address deployment constraints, the IQuest-Coder-V1-Loop variant introduces a recurrent mechanism designed to optimize the trade-off between model capacity and deployment footprint, offering an architecturally enhanced path for efficacy-efficiency trade-off. We believe the release of the IQuest-Coder-V1 series, including the complete white-box chain of checkpoints from pre-training bases to the final thinking and instruction models, will advance research in autonomous code intelligence and real-world agentic systems.
PDF01March 28, 2026