InCoder-32B-Thinking: Modelo de Mundo de Código Industrial para Raciocínio
InCoder-32B-Thinking: Industrial Code World Model for Thinking
April 3, 2026
Autores: Jian Yang, Wei Zhang, Jiajun Wu, Junhang Cheng, Tuney Zheng, Fanglin Xu, Weicheng Gu, Lin Jing, Yaxin Du, Joseph Li, Yizhi Li, Yan Xing, Chuan Hao, Ran Tao, Ruihao Gong, Aishan Liu, Zhoujun Li, Mingjie Tang, Chenghua Lin, Siheng Chen, Wayne Xin Zhao, Xianglong Liu, Ming Zhou, Bryan Dai, Weifeng Lv
cs.AI
Resumo
O desenvolvimento de software industrial nas áreas de projeto de chips, otimização de GPU e sistemas embarcados carece de traços de raciocínio especializado que mostrem como os engenheiros raciocinam sobre restrições de hardware e semântica de temporização. Neste trabalho, propomos o InCoder-32B-Thinking, treinado com dados do framework de síntese Error-driven Chain-of-Thought (ECoT) com um modelo de mundo de código industrial (ICWM) para gerar traços de raciocínio. Especificamente, o ECoT gera cadeias de raciocínio sintetizando o conteúdo de pensamento a partir de diálogos multi-turn com feedback de erro ambiental, modelando explicitamente o processo de correção de erros. O ICWM é treinado em traços de execução específicos de domínio, como simulação Verilog e profiling de GPU, aprende a dinâmica causal de como o código afeta o comportamento do hardware e permite a autoverificação ao prever resultados de execução antes da compilação real. Todos os traços de raciocínio sintetizados são validados por toolchains de domínio, criando dados de treinamento que correspondem à distribuição natural de profundidade de raciocínio de tarefas industriais. A avaliação em 14 benchmarks gerais (81,3% no LiveCodeBench v5) e 9 benchmarks industriais (84,0% no CAD-Coder e 38,0% no KernelBench) mostra que o InCoder-32B-Thinking alcança resultados de código aberto de primeira linha em todos os domínios.
English
Industrial software development across chip design, GPU optimization, and embedded systems lacks expert reasoning traces showing how engineers reason about hardware constraints and timing semantics. In this work, we propose InCoder-32B-Thinking, trained on the data from the Error-driven Chain-of-Thought (ECoT) synthesis framework with an industrial code world model (ICWM) to generate reasoning traces. Specifically, ECoT generates reasoning chains by synthesizing the thinking content from multi-turn dialogue with environmental error feedback, explicitly modeling the error-correction process. ICWM is trained on domain-specific execution traces from Verilog simulation, GPU profiling, etc., learns the causal dynamics of how code affects hardware behavior, and enables self-verification by predicting execution outcomes before actual compilation. All synthesized reasoning traces are validated through domain toolchains, creating training data matching the natural reasoning depth distribution of industrial tasks. Evaluation on 14 general (81.3% on LiveCodeBench v5) and 9 industrial benchmarks (84.0% in CAD-Coder and 38.0% on KernelBench) shows InCoder-32B-Thinking achieves top-tier open-source results across all domains.GPU Optimization