CraftsMan: Генерация сетки высокой точности с 3D нативной генерацией и интерактивным улучшителем геометрии.
CraftsMan: High-fidelity Mesh Generation with 3D Native Generation and Interactive Geometry Refiner
May 23, 2024
Авторы: Weiyu Li, Jiarui Liu, Rui Chen, Yixun Liang, Xuelin Chen, Ping Tan, Xiaoxiao Long
cs.AI
Аннотация
Мы представляем новую систему генеративного 3D-моделирования под названием CraftsMan, способную создавать трехмерные геометрические объекты высокого качества с разнообразными формами, регулярной сеткой и детализированными поверхностями, а также позволяющую интерактивно уточнять геометрию. Несмотря на значительные достижения в области 3D-генерации, существующие методы все еще сталкиваются с длительными процессами оптимизации, нерегулярными сетками, шумными поверхностями и сложностями в учете пользовательских правок, что затрудняет их широкое применение и внедрение в программное обеспечение для 3D-моделирования. Наша работа вдохновлена ремесленником, который обычно сначала грубо набрасывает общую форму работы, а затем разрабатывает детали поверхности. В частности, мы используем трехмерную диффузионную модель, которая работает в латентном пространстве, изученном на основе латентных наборов трехмерных представлений, для создания грубых геометрических объектов с регулярной сеткой за считанные секунды. Этот процесс принимает на вход текстовую подсказку или изображение-ссылку и использует мощную многозрительную (MV) диффузионную модель для генерации нескольких видов грубой геометрии, которые подаются на вход нашей MV-условной 3D-диффузионной модели для создания трехмерной геометрии, значительно повышая устойчивость и обобщаемость. Затем используется улучшитель геометрии на основе нормалей для значительного улучшения деталей поверхности. Это уточнение может быть выполнено автоматически или интерактивно с учетом правок, внесенных пользователем. Обширные эксперименты показывают, что наш метод обладает высокой эффективностью в создании трехмерных объектов высокого качества по сравнению с существующими методами. Домашняя страница: https://craftsman3d.github.io/, Код: https://github.com/wyysf-98/CraftsMan
English
We present a novel generative 3D modeling system, coined CraftsMan, which can
generate high-fidelity 3D geometries with highly varied shapes, regular mesh
topologies, and detailed surfaces, and, notably, allows for refining the
geometry in an interactive manner. Despite the significant advancements in 3D
generation, existing methods still struggle with lengthy optimization
processes, irregular mesh topologies, noisy surfaces, and difficulties in
accommodating user edits, consequently impeding their widespread adoption and
implementation in 3D modeling software. Our work is inspired by the craftsman,
who usually roughs out the holistic figure of the work first and elaborates the
surface details subsequently. Specifically, we employ a 3D native diffusion
model, which operates on latent space learned from latent set-based 3D
representations, to generate coarse geometries with regular mesh topology in
seconds. In particular, this process takes as input a text prompt or a
reference image and leverages a powerful multi-view (MV) diffusion model to
generate multiple views of the coarse geometry, which are fed into our
MV-conditioned 3D diffusion model for generating the 3D geometry, significantly
improving robustness and generalizability. Following that, a normal-based
geometry refiner is used to significantly enhance the surface details. This
refinement can be performed automatically, or interactively with user-supplied
edits. Extensive experiments demonstrate that our method achieves high efficacy
in producing superior-quality 3D assets compared to existing methods. HomePage:
https://craftsman3d.github.io/, Code: https://github.com/wyysf-98/CraftsManSummary
AI-Generated Summary