InCoder-32B-Thinking: Industrieel Codewereldmodel voor Denkprocessen
InCoder-32B-Thinking: Industrial Code World Model for Thinking
April 3, 2026
Auteurs: Jian Yang, Wei Zhang, Jiajun Wu, Junhang Cheng, Tuney Zheng, Fanglin Xu, Weicheng Gu, Lin Jing, Yaxin Du, Joseph Li, Yizhi Li, Yan Xing, Chuan Hao, Ran Tao, Ruihao Gong, Aishan Liu, Zhoujun Li, Mingjie Tang, Chenghua Lin, Siheng Chen, Wayne Xin Zhao, Xianglong Liu, Ming Zhou, Bryan Dai, Weifeng Lv
cs.AI
Samenvatting
De ontwikkeling van industriële software op het gebied van chipontwerp, GPU-optimalisatie en ingebedde systemen kampt met een gebrek aan expert reasoning traces die laten zien hoe ingenieurs redeneren over hardwarebeperkingen en timing-semantiek. In dit werk stellen we InCoder-32B-Thinking voor, getraind op data van het Error-driven Chain-of-Thought (ECoT) syntheseframework met een industrieel codewereldmodel (ICWM) om redeneersporen te genereren. Concreet genereert ECoT redeneerketens door denkinhoud te synthetiseren uit meerluikgesprekken met omgevingsfeedback op fouten, waarbij het correctieproces expliciet wordt gemodelleerd. ICWM is getraind op domeinspecifieke uitvoeringssporen van Verilog-simulatie, GPU-profiling, enz., leert de causale dynamiek van hoe code hardwaregedrag beïnvloedt, en maakt zelfverificatie mogelijk door uitvoeringsresultaten te voorspellen vóór daadwerkelijke compilatie. Alle gesynthetiseerde redeneersporen worden gevalideerd via domeinspecifieke toolchains, waardoor trainingsdata ontstaat die overeenkomt met de natuurlijke redeneerdiepteverdeling van industriële taken. Evaluatie op 14 algemene (81,3% op LiveCodeBench v5) en 9 industriële benchmarks (84,0% op CAD-Coder en 38,0% op KernelBench) toont aan dat InCoder-32B-Thinking toonaangevende open-source resultaten behaalt in alle domeinen.
English
Industrial software development across chip design, GPU optimization, and embedded systems lacks expert reasoning traces showing how engineers reason about hardware constraints and timing semantics. In this work, we propose InCoder-32B-Thinking, trained on the data from the Error-driven Chain-of-Thought (ECoT) synthesis framework with an industrial code world model (ICWM) to generate reasoning traces. Specifically, ECoT generates reasoning chains by synthesizing the thinking content from multi-turn dialogue with environmental error feedback, explicitly modeling the error-correction process. ICWM is trained on domain-specific execution traces from Verilog simulation, GPU profiling, etc., learns the causal dynamics of how code affects hardware behavior, and enables self-verification by predicting execution outcomes before actual compilation. All synthesized reasoning traces are validated through domain toolchains, creating training data matching the natural reasoning depth distribution of industrial tasks. Evaluation on 14 general (81.3% on LiveCodeBench v5) and 9 industrial benchmarks (84.0% in CAD-Coder and 38.0% on KernelBench) shows InCoder-32B-Thinking achieves top-tier open-source results across all domains.GPU Optimization