InCoder-32B-Thinking : Modèle du Monde du Code Industriel pour la Pensée
InCoder-32B-Thinking: Industrial Code World Model for Thinking
April 3, 2026
Auteurs: Jian Yang, Wei Zhang, Jiajun Wu, Junhang Cheng, Tuney Zheng, Fanglin Xu, Weicheng Gu, Lin Jing, Yaxin Du, Joseph Li, Yizhi Li, Yan Xing, Chuan Hao, Ran Tao, Ruihao Gong, Aishan Liu, Zhoujun Li, Mingjie Tang, Chenghua Lin, Siheng Chen, Wayne Xin Zhao, Xianglong Liu, Ming Zhou, Bryan Dai, Weifeng Lv
cs.AI
Résumé
Le développement de logiciels industriels, qu'il s'agisse de la conception de puces, de l'optimisation des GPU ou des systèmes embarqués, manque de traces de raisonnement expertes montrant comment les ingénieurs raisonnent face aux contraintes matérielles et à la sémantique temporelle. Dans ce travail, nous proposons InCoder-32B-Thinking, entraîné sur les données du cadre de synthèse Error-driven Chain-of-Thought (ECoT) avec un modèle de monde de code industriel (ICWM) pour générer des traces de raisonnement. Plus précisément, ECoT génère des chaînes de raisonnement en synthétisant le contenu de réflexion à partir d'un dialogue multitour avec un retour d'erreur environnemental, modélisant explicitement le processus de correction d'erreurs. ICWM est entraîné sur des traces d'exécution spécifiques au domaine (simulation Verilog, profilage GPU, etc.), apprend la dynamique causale de l'impact du code sur le comportement matériel et permet l'auto-vérification en prédisant les résultats d'exécution avant la compilation réelle. Toutes les traces de raisonnement synthétisées sont validées via des chaînes d'outils métier, créant ainsi des données d'entraînement correspondant à la distribution naturelle de la profondeur de raisonnement des tâches industrielles. L'évaluation sur 14 benchmarks généraux (81,3 % sur LiveCodeBench v5) et 9 benchmarks industriels (84,0 % sur CAD-Coder et 38,0 % sur KernelBench) montre qu'InCoder-32B-Thinking obtient des résultats open-source de premier plan dans tous les domaines.
English
Industrial software development across chip design, GPU optimization, and embedded systems lacks expert reasoning traces showing how engineers reason about hardware constraints and timing semantics. In this work, we propose InCoder-32B-Thinking, trained on the data from the Error-driven Chain-of-Thought (ECoT) synthesis framework with an industrial code world model (ICWM) to generate reasoning traces. Specifically, ECoT generates reasoning chains by synthesizing the thinking content from multi-turn dialogue with environmental error feedback, explicitly modeling the error-correction process. ICWM is trained on domain-specific execution traces from Verilog simulation, GPU profiling, etc., learns the causal dynamics of how code affects hardware behavior, and enables self-verification by predicting execution outcomes before actual compilation. All synthesized reasoning traces are validated through domain toolchains, creating training data matching the natural reasoning depth distribution of industrial tasks. Evaluation on 14 general (81.3% on LiveCodeBench v5) and 9 industrial benchmarks (84.0% in CAD-Coder and 38.0% on KernelBench) shows InCoder-32B-Thinking achieves top-tier open-source results across all domains.GPU Optimization