CADEvolve: Создание реалистичных CAD-моделей с помощью эволюции программ
CADEvolve: Creating Realistic CAD via Program Evolution
February 18, 2026
Авторы: Maksim Elistratov, Marina Barannikov, Gregory Ivanov, Valentin Khrulkov, Anton Konushin, Andrey Kuznetsov, Dmitrii Zhemchuzhnikov
cs.AI
Аннотация
Системы автоматизированного проектирования (САПР) обеспечивают быстрое создание редактируемых моделей для инженерных задач и производства. Недавние достижения в области искусственного интеллекта сделали полную автоматизацию выполнимой для широкого спектра задач САПР. Однако прогресс сдерживается проблемой данных: публичные корпуса в основном содержат последовательности операций "эскиз-выдавливание", лишены сложных операций, композиции из множества операций и информации о проектных намерениях, что препятствует эффективному тонкому настрою. Попытки обойти это ограничение с помощью замороженных больших языковых моделей (VLM) часто приводят к созданию простых или невалидных программ из-за слабого понимания трехмерного контекста в современных базовых моделях. Мы представляем CADEvolve, эволюционный конвейер и набор данных, который начинается с простых примитивов и, благодаря редактированию и валидации под управлением VLM, постепенно наращивает сложность программ САПР до промышленного уровня. Результатом стали 8 тысяч сложных деталей, выраженных в виде исполняемых параметрических генераторов на CadQuery. После многоэтапной постобработки и аугментации мы получили унифицированный набор данных из 1,3 миллиона скриптов, сопряженных с визуализированной геометрией и использующих полный набор операций CadQuery. VLM, прошедшая тонкую настройку на CADEvolve, демонстрирует наилучшие результаты на задаче Image2CAD по всем бенчмаркам: DeepCAD, Fusion 360 и MCB.
English
Computer-Aided Design (CAD) delivers rapid, editable modeling for engineering and manufacturing. Recent AI progress now makes full automation feasible for various CAD tasks. However, progress is bottlenecked by data: public corpora mostly contain sketch-extrude sequences, lack complex operations, multi-operation composition and design intent, and thus hinder effective fine-tuning. Attempts to bypass this with frozen VLMs often yield simple or invalid programs due to limited 3D grounding in current foundation models. We present CADEvolve, an evolution-based pipeline and dataset that starts from simple primitives and, via VLM-guided edits and validations, incrementally grows CAD programs toward industrial-grade complexity. The result is 8k complex parts expressed as executable CadQuery parametric generators. After multi-stage post-processing and augmentation, we obtain a unified dataset of 1.3m scripts paired with rendered geometry and exercising the full CadQuery operation set. A VLM fine-tuned on CADEvolve achieves state-of-the-art results on the Image2CAD task across the DeepCAD, Fusion 360, and MCB benchmarks.