CraftsMan: Generazione di Mesh ad Alta Fedeltà con Generazione 3D Nativa e Affinatore Geometrico Interattivo
CraftsMan: High-fidelity Mesh Generation with 3D Native Generation and Interactive Geometry Refiner
May 23, 2024
Autori: Weiyu Li, Jiarui Liu, Rui Chen, Yixun Liang, Xuelin Chen, Ping Tan, Xiaoxiao Long
cs.AI
Abstract
Presentiamo un innovativo sistema di modellazione 3D generativa, denominato CraftsMan, in grado di generare geometrie 3D ad alta fedeltà con forme altamente variabili, topologie di mesh regolari e superfici dettagliate, e, in particolare, consente di affinare la geometria in modo interattivo. Nonostante i significativi progressi nella generazione 3D, i metodi esistenti continuano a lottare con processi di ottimizzazione lunghi, topologie di mesh irregolari, superfici rumorose e difficoltà nell'accomodare le modifiche dell'utente, ostacolando di conseguenza la loro ampia adozione e implementazione nei software di modellazione 3D. Il nostro lavoro è ispirato dall'artigiano, che solitamente abbozza prima la figura complessiva dell'opera e successivamente elabora i dettagli superficiali. Nello specifico, utilizziamo un modello di diffusione 3D nativo, che opera su uno spazio latente appreso da rappresentazioni 3D basate su insiemi latenti, per generare geometrie grezze con topologia di mesh regolare in pochi secondi. In particolare, questo processo prende in input un prompt testuale o un'immagine di riferimento e sfrutta un potente modello di diffusione multi-vista (MV) per generare multiple viste della geometria grezza, che vengono poi alimentate nel nostro modello di diffusione 3D condizionato MV per generare la geometria 3D, migliorando significativamente robustezza e generalizzabilità. Successivamente, un affinatore di geometria basato sulle normali viene utilizzato per migliorare significativamente i dettagli superficiali. Questo affinamento può essere eseguito automaticamente o in modo interattivo con le modifiche fornite dall'utente. Esperimenti estensivi dimostrano che il nostro metodo raggiunge un'elevata efficacia nella produzione di asset 3D di qualità superiore rispetto ai metodi esistenti. HomePage: https://craftsman3d.github.io/, Codice: https://github.com/wyysf-98/CraftsMan
English
We present a novel generative 3D modeling system, coined CraftsMan, which can
generate high-fidelity 3D geometries with highly varied shapes, regular mesh
topologies, and detailed surfaces, and, notably, allows for refining the
geometry in an interactive manner. Despite the significant advancements in 3D
generation, existing methods still struggle with lengthy optimization
processes, irregular mesh topologies, noisy surfaces, and difficulties in
accommodating user edits, consequently impeding their widespread adoption and
implementation in 3D modeling software. Our work is inspired by the craftsman,
who usually roughs out the holistic figure of the work first and elaborates the
surface details subsequently. Specifically, we employ a 3D native diffusion
model, which operates on latent space learned from latent set-based 3D
representations, to generate coarse geometries with regular mesh topology in
seconds. In particular, this process takes as input a text prompt or a
reference image and leverages a powerful multi-view (MV) diffusion model to
generate multiple views of the coarse geometry, which are fed into our
MV-conditioned 3D diffusion model for generating the 3D geometry, significantly
improving robustness and generalizability. Following that, a normal-based
geometry refiner is used to significantly enhance the surface details. This
refinement can be performed automatically, or interactively with user-supplied
edits. Extensive experiments demonstrate that our method achieves high efficacy
in producing superior-quality 3D assets compared to existing methods. HomePage:
https://craftsman3d.github.io/, Code: https://github.com/wyysf-98/CraftsMan