InCoder-32B-Thinking: Modello Mondiale del Codice Industriale per il Ragionamento
InCoder-32B-Thinking: Industrial Code World Model for Thinking
April 3, 2026
Autori: Jian Yang, Wei Zhang, Jiajun Wu, Junhang Cheng, Tuney Zheng, Fanglin Xu, Weicheng Gu, Lin Jing, Yaxin Du, Joseph Li, Yizhi Li, Yan Xing, Chuan Hao, Ran Tao, Ruihao Gong, Aishan Liu, Zhoujun Li, Mingjie Tang, Chenghua Lin, Siheng Chen, Wayne Xin Zhao, Xianglong Liu, Ming Zhou, Bryan Dai, Weifeng Lv
cs.AI
Abstract
Lo sviluppo di software industriale nell'ambito della progettazione di chip, dell'ottimizzazione GPU e dei sistemi embedded manca di tracce di ragionamento esperto che mostrino come gli ingegneri ragionano sui vincoli hardware e sulla semantica temporale. In questo lavoro, proponiamo InCoder-32B-Thinking, addestrato sui dati del framework di sintesi Error-driven Chain-of-Thought (ECoT) con un modello del mondo del codice industriale (ICWM) per generare tracce di ragionamento. Nello specifico, ECoT genera catene di ragionamento sintetizzando il contenuto del pensiero da dialoghi multi-turno con feedback di errore ambientale, modellando esplicitamente il processo di correzione degli errori. ICWM è addestrato su tracce di esecuzione specifiche del dominio provenienti da simulazioni Verilog, profilazioni GPU, ecc., apprende le dinamiche causali di come il codice influisce sul comportamento hardware e abilita l'auto-verifica prevedendo i risultati dell'esecuzione prima della compilazione effettiva. Tutte le tracce di ragionamento sintetizzate sono validate attraverso toolchain di dominio, creando dati di addestramento che corrispondono alla distribuzione naturale della profondità di ragionamento dei compiti industriali. La valutazione su 14 benchmark generali (81.3% su LiveCodeBench v5) e 9 benchmark industriali (84.0% su CAD-Coder e 38.0% su KernelBench) mostra che InCoder-32B-Thinking raggiunge risultati di primo livello tra i modelli open-source in tutti i domini.
English
Industrial software development across chip design, GPU optimization, and embedded systems lacks expert reasoning traces showing how engineers reason about hardware constraints and timing semantics. In this work, we propose InCoder-32B-Thinking, trained on the data from the Error-driven Chain-of-Thought (ECoT) synthesis framework with an industrial code world model (ICWM) to generate reasoning traces. Specifically, ECoT generates reasoning chains by synthesizing the thinking content from multi-turn dialogue with environmental error feedback, explicitly modeling the error-correction process. ICWM is trained on domain-specific execution traces from Verilog simulation, GPU profiling, etc., learns the causal dynamics of how code affects hardware behavior, and enables self-verification by predicting execution outcomes before actual compilation. All synthesized reasoning traces are validated through domain toolchains, creating training data matching the natural reasoning depth distribution of industrial tasks. Evaluation on 14 general (81.3% on LiveCodeBench v5) and 9 industrial benchmarks (84.0% in CAD-Coder and 38.0% on KernelBench) shows InCoder-32B-Thinking achieves top-tier open-source results across all domains.GPU Optimization