NURBGen : Génération de CAO haute fidélité à partir de texte par modélisation NURBS pilotée par LLM
NURBGen: High-Fidelity Text-to-CAD Generation through LLM-Driven NURBS Modeling
November 9, 2025
papers.authors: Muhammad Usama, Mohammad Sadil Khan, Didier Stricker, Muhammad Zeshan Afzal
cs.AI
papers.abstract
La génération de modèles CAO 3D éditables à partir du langage naturel reste un défi, car les systèmes texte-à-CAO existants produisent soit des maillages, soit s'appuient sur des données historiques de conception rares. Nous présentons NURBGen, le premier cadre capable de générer des modèles CAO 3D haute fidélité directement à partir de texte en utilisant les B-splines rationnelles non uniformes (NURBS). Pour y parvenir, nous affinons un grand modèle de langage (LLM) pour traduire des textes en forme libre en représentations JSON contenant les paramètres de surface NURBS (c'est-à-dire les points de contrôle, les vecteurs de nœuds, les degrés et les poids rationnels), qui peuvent être directement convertis au format BRep à l'aide de Python. Nous proposons en outre une représentation hybride qui combine les NURBS non rognées avec des primitives analytiques pour gérer plus robustement les surfaces rognées et les régions dégénérées, tout en réduisant la complexité des tokens. De plus, nous introduisons partABC, un sous-ensemble organisé de la base de données ABC constitué de composants CAO individuels, annotés avec des légendes détaillées à l'aide d'un pipeline d'annotation automatisé. NURBGen démontre de solides performances sur des invites variées, surpassant les méthodes antérieures en termes de fidélité géométrique et de précision dimensionnelle, comme le confirment des évaluations d'experts. Le code et l'ensemble de données seront rendus publics.
English
Generating editable 3D CAD models from natural language remains challenging,
as existing text-to-CAD systems either produce meshes or rely on scarce
design-history data. We present NURBGen, the first framework to generate
high-fidelity 3D CAD models directly from text using Non-Uniform Rational
B-Splines (NURBS). To achieve this, we fine-tune a large language model (LLM)
to translate free-form texts into JSON representations containing NURBS surface
parameters (i.e, control points, knot vectors, degrees, and rational
weights) which can be directly converted into BRep format using Python. We
further propose a hybrid representation that combines untrimmed NURBS with
analytic primitives to handle trimmed surfaces and degenerate regions more
robustly, while reducing token complexity. Additionally, we introduce partABC,
a curated subset of the ABC dataset consisting of individual CAD components,
annotated with detailed captions using an automated annotation pipeline.
NURBGen demonstrates strong performance on diverse prompts, surpassing prior
methods in geometric fidelity and dimensional accuracy, as confirmed by expert
evaluations. Code and dataset will be released publicly.