ChatPaper.aiChatPaper

InCoder-32B-Thinking: Modelo de Mundo de Código Industrial para el Pensamiento

InCoder-32B-Thinking: Industrial Code World Model for Thinking

April 3, 2026
Autores: Jian Yang, Wei Zhang, Jiajun Wu, Junhang Cheng, Tuney Zheng, Fanglin Xu, Weicheng Gu, Lin Jing, Yaxin Du, Joseph Li, Yizhi Li, Yan Xing, Chuan Hao, Ran Tao, Ruihao Gong, Aishan Liu, Zhoujun Li, Mingjie Tang, Chenghua Lin, Siheng Chen, Wayne Xin Zhao, Xianglong Liu, Ming Zhou, Bryan Dai, Weifeng Lv
cs.AI

Resumen

El desarrollo de software industrial en áreas como el diseño de chips, la optimización de GPU y los sistemas embebidos carece de trazas de razonamiento experto que muestren cómo los ingenieros razonan sobre las restricciones de hardware y la semántica de temporización. En este trabajo, proponemos InCoder-32B-Thinking, entrenado con datos del marco de síntesis Cadena de Pensamiento Guiada por Errores (ECoT) utilizando un modelo de mundo de código industrial (ICWM) para generar trazas de razonamiento. Específicamente, ECoT genera cadenas de razonamiento sintetizando el contenido de pensamiento a partir de diálogos multiturno con retroalimentación de errores del entorno, modelando explícitamente el proceso de corrección de errores. ICWM se entrena con trazas de ejecución específicas del dominio, como simulaciones de Verilog y perfiles de GPU, aprende la dinámica causal de cómo el código afecta el comportamiento del hardware y permite la autoverificación prediciendo resultados de ejecución antes de la compilación real. Todas las trazas de razonamiento sintetizadas se validan mediante toolchains de dominio, creando datos de entrenamiento que coinciden con la distribución natural de profundidad de razonamiento de las tareas industriales. La evaluación en 14 benchmarks generales (81.3% en LiveCodeBench v5) y 9 benchmarks industriales (84.0% en CAD-Coder y 38.0% en KernelBench) muestra que InCoder-32B-Thinking logra resultados de código abierto de primer nivel en todos los dominios.
English
Industrial software development across chip design, GPU optimization, and embedded systems lacks expert reasoning traces showing how engineers reason about hardware constraints and timing semantics. In this work, we propose InCoder-32B-Thinking, trained on the data from the Error-driven Chain-of-Thought (ECoT) synthesis framework with an industrial code world model (ICWM) to generate reasoning traces. Specifically, ECoT generates reasoning chains by synthesizing the thinking content from multi-turn dialogue with environmental error feedback, explicitly modeling the error-correction process. ICWM is trained on domain-specific execution traces from Verilog simulation, GPU profiling, etc., learns the causal dynamics of how code affects hardware behavior, and enables self-verification by predicting execution outcomes before actual compilation. All synthesized reasoning traces are validated through domain toolchains, creating training data matching the natural reasoning depth distribution of industrial tasks. Evaluation on 14 general (81.3% on LiveCodeBench v5) and 9 industrial benchmarks (84.0% in CAD-Coder and 38.0% on KernelBench) shows InCoder-32B-Thinking achieves top-tier open-source results across all domains.GPU Optimization
PDF60April 7, 2026