InCoder-32B-Thinking: Industrielles Code-Weltmodell für Denkprozesse
InCoder-32B-Thinking: Industrial Code World Model for Thinking
April 3, 2026
Autoren: Jian Yang, Wei Zhang, Jiajun Wu, Junhang Cheng, Tuney Zheng, Fanglin Xu, Weicheng Gu, Lin Jing, Yaxin Du, Joseph Li, Yizhi Li, Yan Xing, Chuan Hao, Ran Tao, Ruihao Gong, Aishan Liu, Zhoujun Li, Mingjie Tang, Chenghua Lin, Siheng Chen, Wayne Xin Zhao, Xianglong Liu, Ming Zhou, Bryan Dai, Weifeng Lv
cs.AI
Zusammenfassung
Die Entwicklung industrieller Software in den Bereichen Chip-Design, GPU-Optimierung und eingebettete Systeme leidet unter einem Mangel an expertengestützten Reasoning-Traces, die aufzeigen, wie Ingenieure über Hardware-Einschränkungen und Zeit-Semantik nachdenken. In dieser Arbeit stellen wir InCoder-32B-Thinking vor, das auf Daten des Error-driven Chain-of-Thought (ECoT)-Syntheseframeworks mit einem industriellen Code-World-Model (ICWM) trainiert wurde, um Reasoning-Traces zu generieren. Konkret generiert ECoT Reasoning-Ketten, indem es Denkinhalte aus mehrschrittigen Dialogen mit Umwelt-Fehlerrückmeldungen synthetisiert und den Fehlerkorrekturprozess explizit modelliert. ICWM wird auf domainspezifischen Ausführungstraces (z.B. aus Verilog-Simulationen, GPU-Profiling) trainiert, erlernt die kausalen Dynamiken davon, wie Code das Hardware-Verhalten beeinflusst, und ermöglicht Selbstverifikation durch die Vorhersage von Ausführungsergebnissen vor der eigentlichen Kompilierung. Alle synthetisierten Reasoning-Traces werden durch Domain-Toolchains validiert, wodurch Trainingsdaten erzeugt werden, die der natürlichen Reasoning-Tiefenverteilung industrieller Aufgaben entsprechen. Die Evaluierung auf 14 allgemeinen (81,3 % auf LiveCodeBench v5) und 9 industriellen Benchmarks (84,0 % auf CAD-Coder und 38,0 % auf KernelBench) zeigt, dass InCoder-32B-Thinking in allen Domänen erstklassige Open-Source-Ergebnisse erzielt.
English
Industrial software development across chip design, GPU optimization, and embedded systems lacks expert reasoning traces showing how engineers reason about hardware constraints and timing semantics. In this work, we propose InCoder-32B-Thinking, trained on the data from the Error-driven Chain-of-Thought (ECoT) synthesis framework with an industrial code world model (ICWM) to generate reasoning traces. Specifically, ECoT generates reasoning chains by synthesizing the thinking content from multi-turn dialogue with environmental error feedback, explicitly modeling the error-correction process. ICWM is trained on domain-specific execution traces from Verilog simulation, GPU profiling, etc., learns the causal dynamics of how code affects hardware behavior, and enables self-verification by predicting execution outcomes before actual compilation. All synthesized reasoning traces are validated through domain toolchains, creating training data matching the natural reasoning depth distribution of industrial tasks. Evaluation on 14 general (81.3% on LiveCodeBench v5) and 9 industrial benchmarks (84.0% in CAD-Coder and 38.0% on KernelBench) shows InCoder-32B-Thinking achieves top-tier open-source results across all domains.GPU Optimization