CADEvolve: Criando CAD Realista por meio de Evolução de Programas
CADEvolve: Creating Realistic CAD via Program Evolution
February 18, 2026
Autores: Maksim Elistratov, Marina Barannikov, Gregory Ivanov, Valentin Khrulkov, Anton Konushin, Andrey Kuznetsov, Dmitrii Zhemchuzhnikov
cs.AI
Resumo
O Design Assistido por Computador (CAD) oferece modelagem rápida e editável para engenharia e manufatura. Os recentes avanços em IA tornam agora viável a automação completa para várias tarefas de CAD. No entanto, o progresso é limitado pelos dados: os corpora públicos contêm principalmente sequências de esboço-extrusão, carecem de operações complexas, composição multioperação e intenção de design, dificultando assim um *fine-tuning* eficaz. Tentativas de contornar isso com VLMs (*Vision-Language Models*) congelados frequentemente produzem programas simples ou inválidos devido à compreensão limitada de modelos de base sobre geometria 3D. Apresentamos o CADEvolve, um *pipeline* e conjunto de dados baseado em evolução que começa com primitivas simples e, por meio de edições e validações guiadas por VLM, cresce incrementalmente programas de CAD em direção à complexidade de nível industrial. O resultado são 8 mil peças complexas expressas como geradores paramétricos executáveis em CadQuery. Após um pós-processamento e aumento de dados em múltiplas etapas, obtemos um conjunto de dados unificado de 1,3 milhão de scripts pareados com geometria renderizada e que exercitam todo o conjunto de operações do CadQuery. Um VLM submetido a *fine-tuning* no CADEvolve alcança resultados de última geração na tarefa Image2CAD através dos *benchmarks* DeepCAD, Fusion 360 e MCB.
English
Computer-Aided Design (CAD) delivers rapid, editable modeling for engineering and manufacturing. Recent AI progress now makes full automation feasible for various CAD tasks. However, progress is bottlenecked by data: public corpora mostly contain sketch-extrude sequences, lack complex operations, multi-operation composition and design intent, and thus hinder effective fine-tuning. Attempts to bypass this with frozen VLMs often yield simple or invalid programs due to limited 3D grounding in current foundation models. We present CADEvolve, an evolution-based pipeline and dataset that starts from simple primitives and, via VLM-guided edits and validations, incrementally grows CAD programs toward industrial-grade complexity. The result is 8k complex parts expressed as executable CadQuery parametric generators. After multi-stage post-processing and augmentation, we obtain a unified dataset of 1.3m scripts paired with rendered geometry and exercising the full CadQuery operation set. A VLM fine-tuned on CADEvolve achieves state-of-the-art results on the Image2CAD task across the DeepCAD, Fusion 360, and MCB benchmarks.