ChatPaper.aiChatPaper

InCoder-32B-Thinking: 思考のための産業コード世界モデル

InCoder-32B-Thinking: Industrial Code World Model for Thinking

April 3, 2026
著者: Jian Yang, Wei Zhang, Jiajun Wu, Junhang Cheng, Tuney Zheng, Fanglin Xu, Weicheng Gu, Lin Jing, Yaxin Du, Joseph Li, Yizhi Li, Yan Xing, Chuan Hao, Ran Tao, Ruihao Gong, Aishan Liu, Zhoujun Li, Mingjie Tang, Chenghua Lin, Siheng Chen, Wayne Xin Zhao, Xianglong Liu, Ming Zhou, Bryan Dai, Weifeng Lv
cs.AI

要旨

チップ設計、GPU最適化、組み込みシステムにわたる産業用ソフトウェア開発では、エンジニアがハードウェア制約やタイミングセマンティクスをどのように推論するかを示す専門的な推論トレースが不足しています。本研究では、Error-driven Chain-of-Thought(ECoT)合成フレームワークからのデータと産業用コード世界モデル(ICWM)を用いて訓練したInCoder-32B-Thinkingを提案し、推論トレースを生成します。具体的には、ECoTは環境からのエラーフィードバックを含むマルチターン対話から思考内容を合成することで推論チェーンを生成し、エラー修正プロセスを明示的にモデル化します。ICWMはVerilogシミュレーションやGPUプロファイリングなどのドメイン固有実行トレースで訓練され、コードがハードウェア動作に与える因果的ダイナミクスを学習し、実際のコンパイル前に実行結果を予測することで自己検証を可能にします。すべての合成推論トレースはドメインツールチェーンで検証され、産業タスクの自然な推論深度分布に合致する訓練データを生成します。14の一般ベンチマーク(LiveCodeBench v5で81.3%)と9つの産業用ベンチマーク(CAD-Coderで84.0%、KernelBenchで38.0%)による評価では、InCoder-32B-Thinkingが全ドメインでトップクラスのオープンソース結果を達成することが示されています。
English
Industrial software development across chip design, GPU optimization, and embedded systems lacks expert reasoning traces showing how engineers reason about hardware constraints and timing semantics. In this work, we propose InCoder-32B-Thinking, trained on the data from the Error-driven Chain-of-Thought (ECoT) synthesis framework with an industrial code world model (ICWM) to generate reasoning traces. Specifically, ECoT generates reasoning chains by synthesizing the thinking content from multi-turn dialogue with environmental error feedback, explicitly modeling the error-correction process. ICWM is trained on domain-specific execution traces from Verilog simulation, GPU profiling, etc., learns the causal dynamics of how code affects hardware behavior, and enables self-verification by predicting execution outcomes before actual compilation. All synthesized reasoning traces are validated through domain toolchains, creating training data matching the natural reasoning depth distribution of industrial tasks. Evaluation on 14 general (81.3% on LiveCodeBench v5) and 9 industrial benchmarks (84.0% in CAD-Coder and 38.0% on KernelBench) shows InCoder-32B-Thinking achieves top-tier open-source results across all domains.GPU Optimization
PDF60April 7, 2026