NURBGen: Генерация CAD-моделей высокой точности по текстовому описанию с помощью NURBS-моделирования на основе больших языковых моделей
NURBGen: High-Fidelity Text-to-CAD Generation through LLM-Driven NURBS Modeling
November 9, 2025
Авторы: Muhammad Usama, Mohammad Sadil Khan, Didier Stricker, Muhammad Zeshan Afzal
cs.AI
Аннотация
Создание редактируемых 3D CAD-моделей из текста на естественном языке остается сложной задачей, поскольку существующие системы text-to-CAD либо генерируют полигональные сетки, либо опираются на дефицитные данные истории проектирования. Мы представляем NURBGen — первую систему, которая генерирует высокоточные 3D CAD-модели непосредственно из текста с использованием неоднородных рациональных B-сплайнов (NURBS). Для этого мы дообучаем большую языковую модель (LLM) для перевода произвольных текстов в JSON-представления, содержащие параметры NURBS-поверхностей (контрольные точки, узловые векторы, степени и рациональные веса), которые можно напрямую конвертировать в формат BRep с помощью Python. Мы также предлагаем гибридное представление, сочетающее необрезанные NURBS-поверхности с аналитическими примитивами для более надежной работы с обрезанными поверхностями и вырожденными областями при одновременном снижении токенной сложности. Дополнительно мы представляем partABC — курируемое подмножество набора данных ABC, состоящее из отдельных CAD-компонентов с детальными текстовыми описаниями, созданными с помощью автоматизированного пайплайна аннотирования. NURBGen демонстрирует высокую производительность на разнообразных запросах, превосходя предыдущие методы по геометрической точности и размерной корректности, что подтверждено экспертной оценкой. Код и набор данных будут опубликованы в открытом доступе.
English
Generating editable 3D CAD models from natural language remains challenging,
as existing text-to-CAD systems either produce meshes or rely on scarce
design-history data. We present NURBGen, the first framework to generate
high-fidelity 3D CAD models directly from text using Non-Uniform Rational
B-Splines (NURBS). To achieve this, we fine-tune a large language model (LLM)
to translate free-form texts into JSON representations containing NURBS surface
parameters (i.e, control points, knot vectors, degrees, and rational
weights) which can be directly converted into BRep format using Python. We
further propose a hybrid representation that combines untrimmed NURBS with
analytic primitives to handle trimmed surfaces and degenerate regions more
robustly, while reducing token complexity. Additionally, we introduce partABC,
a curated subset of the ABC dataset consisting of individual CAD components,
annotated with detailed captions using an automated annotation pipeline.
NURBGen demonstrates strong performance on diverse prompts, surpassing prior
methods in geometric fidelity and dimensional accuracy, as confirmed by expert
evaluations. Code and dataset will be released publicly.