CADEvolve: Creación de CAD Realista mediante Evolución de Programas
CADEvolve: Creating Realistic CAD via Program Evolution
February 18, 2026
Autores: Maksim Elistratov, Marina Barannikov, Gregory Ivanov, Valentin Khrulkov, Anton Konushin, Andrey Kuznetsov, Dmitrii Zhemchuzhnikov
cs.AI
Resumen
El Diseño Asistido por Computadora (CAD) proporciona modelado rápido y editable para ingeniería y manufactura. Los recientes avances en IA hacen factible la automatización completa de diversas tareas de CAD. Sin embargo, el progreso se ve limitado por los datos: los corpus públicos contienen principalmente secuencias de boceto-extrusión, carecen de operaciones complejas, composición multioperación e intención de diseño, lo que dificulta un ajuste fino efectivo. Los intentos de sortear esto usando Modelos de Lenguaje Visual (VLM) congelados a menudo producen programas simples o inválidos debido a la limitada comprensión 3D en los modelos base actuales. Presentamos CADEvolve, una metodología y conjunto de datos basados en evolución que parte de primitivas simples y, mediante ediciones y validaciones guiadas por VLM, incrementa progresivamente la complejidad de los programas de CAD hasta alcanzar niveles industriales. El resultado son 8k piezas complejas expresadas como generadores paramétricos ejecutables en CadQuery. Tras un postprocesamiento y aumento multi-etapa, obtenemos un conjunto de datos unificado de 1.3 millones de scripts emparejados con geometría renderizada que ejercitan el conjunto completo de operaciones de CadQuery. Un VLM ajustado sobre CADEvolve logra resultados de vanguardia en la tarea Image2CAD a través de los benchmarks DeepCAD, Fusion 360 y MCB.
English
Computer-Aided Design (CAD) delivers rapid, editable modeling for engineering and manufacturing. Recent AI progress now makes full automation feasible for various CAD tasks. However, progress is bottlenecked by data: public corpora mostly contain sketch-extrude sequences, lack complex operations, multi-operation composition and design intent, and thus hinder effective fine-tuning. Attempts to bypass this with frozen VLMs often yield simple or invalid programs due to limited 3D grounding in current foundation models. We present CADEvolve, an evolution-based pipeline and dataset that starts from simple primitives and, via VLM-guided edits and validations, incrementally grows CAD programs toward industrial-grade complexity. The result is 8k complex parts expressed as executable CadQuery parametric generators. After multi-stage post-processing and augmentation, we obtain a unified dataset of 1.3m scripts paired with rendered geometry and exercising the full CadQuery operation set. A VLM fine-tuned on CADEvolve achieves state-of-the-art results on the Image2CAD task across the DeepCAD, Fusion 360, and MCB benchmarks.