Van nul naar CAD: Agent-gebaseerde synthese van interpreteerbare CAD-programma's op miljoenschaal zonder echte data

Samenvatting

Computer-Aided Design (CAD)-modellen worden gedefinieerd door hun constructiegeschiedenis: een parametrisch recept dat de ontwerpintentie vastlegt. Bestaande grootschalige 3D-datasets bestaan echter voornamelijk uit boundary representations (B-Reps) of meshes, waarbij deze cruciale procedurele informatie verloren gaat. Om dit gebrek te adresseren, introduceren we Zero-to-CAD, een schaalbaar raamwerk voor het synthetiseren van uitvoerbare CAD-constructiesequenties. Wij formuleren synthese als een agent-gedreven zoekprobleem: door een groot taalmodel (LLM) in te bedden in een op feedback gestuurd CAD-omgeving, genereert, executeert en valideert ons systeem iteratief code met behulp van tools en documentatierichtlijnen om geometrische geldigheid en operationele diversiteit te bevorderen. Deze agent-gedreven aanpak maakt de synthese mogelijk van ongeveer één miljoen uitvoerbare, leesbare en bewerkbare CAD-sequenties, die een rijk vocabulaire aan operaties bestrijken, verdergaand dan sketch-and-extrude-workflows. We publiceren ook een gecureerde subset van 100.000 hoogwaardige modellen, geselecteerd op geometrische diversiteit. Om de bruikbaarheid van de dataset aan te tonen, fine-tunen we een vision-language model op onze synthetische data om bewerkbare CAD-programma's te reconstrueren uit multi-view beelden, waarbij sterke baselines, inclusief GPT-5.2, worden overtroffen en de mogelijkheid tot sequentiegeneratie effectief wordt gebootstrap zonder trainingsdata met echte constructiegeschiedenis. Zero-to-CAD overbrugt de kloof tussen geometrische schaal en parametrische interpreteerbaarheid, en biedt een cruciale bron voor de volgende generatie CAD-AI.

English

Computer-Aided Design (CAD) models are defined by their construction history: a parametric recipe that encodes design intent. However, existing large-scale 3D datasets predominantly consist of boundary representations (B-Reps) or meshes, stripping away this critical procedural information. To address this scarcity, we introduce Zero-to-CAD, a scalable framework for synthesizing executable CAD construction sequences. We frame synthesis as an agentic search problem: by embedding a large language model (LLM) within a feedback-driven CAD environment, our system iteratively generates, executes, and validates code using tools and documentation lookup to promote geometric validity and operation diversity. This agentic approach enables the synthesis of approximately one million executable, readable, editable CAD sequences, covering a rich vocabulary of operations beyond sketch-and-extrude workflows. We also release a curated subset of 100,000 high-quality models selected for geometric diversity. To demonstrate the dataset's utility, we fine-tune a vision-language model on our synthetic data to reconstruct editable CAD programs from multi-view images, outperforming strong baselines, including GPT-5.2, and effectively bootstrapping sequence generation capabilities without real construction-history training data. Zero-to-CAD bridges the gap between geometric scale and parametric interpretability, offering a vital resource for the next generation of CAD AI.

Van nul naar CAD: Agent-gebaseerde synthese van interpreteerbare CAD-programma's op miljoenschaal zonder echte data

Zero-to-CAD: Agentic Synthesis of Interpretable CAD Programs at Million-Scale Without Real Data

Samenvatting

Support