CraftsMan : Génération de maillages haute fidélité avec création native 3D et raffinement géométrique interactif
CraftsMan: High-fidelity Mesh Generation with 3D Native Generation and Interactive Geometry Refiner
May 23, 2024
Auteurs: Weiyu Li, Jiarui Liu, Rui Chen, Yixun Liang, Xuelin Chen, Ping Tan, Xiaoxiao Long
cs.AI
Résumé
Nous présentons un nouveau système de modélisation 3D générative, baptisé CraftsMan, capable de générer des géométries 3D haute fidélité avec des formes très variées, des topologies de maillage régulières et des surfaces détaillées, et, surtout, permettant d'affiner la géométrie de manière interactive. Malgré les avancées significatives dans la génération 3D, les méthodes existantes peinent encore avec des processus d'optimisation longs, des topologies de maillage irrégulières, des surfaces bruyantes et des difficultés à intégrer les modifications des utilisateurs, ce qui entrave leur adoption généralisée et leur implémentation dans les logiciels de modélisation 3D. Notre travail s'inspire de l'artisan, qui esquisse généralement la figure globale de l'œuvre avant d'en détailler les surfaces. Plus précisément, nous utilisons un modèle de diffusion natif 3D, qui opère sur un espace latent appris à partir de représentations 3D basées sur des ensembles latents, pour générer des géométries grossières avec une topologie de maillage régulière en quelques secondes. Ce processus prend en entrée une invite textuelle ou une image de référence et s'appuie sur un puissant modèle de diffusion multi-vues (MV) pour générer plusieurs vues de la géométrie grossière, qui sont ensuite introduites dans notre modèle de diffusion 3D conditionné par les MV pour générer la géométrie 3D, améliorant ainsi significativement la robustesse et la généralisabilité. Ensuite, un raffineur de géométrie basé sur les normales est utilisé pour améliorer considérablement les détails de surface. Ce raffinement peut être effectué automatiquement ou de manière interactive avec les modifications fournies par l'utilisateur. Des expériences approfondies démontrent que notre méthode atteint une efficacité élevée dans la production d'actifs 3D de qualité supérieure par rapport aux méthodes existantes. Page d'accueil : https://craftsman3d.github.io/, Code : https://github.com/wyysf-98/CraftsMan
English
We present a novel generative 3D modeling system, coined CraftsMan, which can
generate high-fidelity 3D geometries with highly varied shapes, regular mesh
topologies, and detailed surfaces, and, notably, allows for refining the
geometry in an interactive manner. Despite the significant advancements in 3D
generation, existing methods still struggle with lengthy optimization
processes, irregular mesh topologies, noisy surfaces, and difficulties in
accommodating user edits, consequently impeding their widespread adoption and
implementation in 3D modeling software. Our work is inspired by the craftsman,
who usually roughs out the holistic figure of the work first and elaborates the
surface details subsequently. Specifically, we employ a 3D native diffusion
model, which operates on latent space learned from latent set-based 3D
representations, to generate coarse geometries with regular mesh topology in
seconds. In particular, this process takes as input a text prompt or a
reference image and leverages a powerful multi-view (MV) diffusion model to
generate multiple views of the coarse geometry, which are fed into our
MV-conditioned 3D diffusion model for generating the 3D geometry, significantly
improving robustness and generalizability. Following that, a normal-based
geometry refiner is used to significantly enhance the surface details. This
refinement can be performed automatically, or interactively with user-supplied
edits. Extensive experiments demonstrate that our method achieves high efficacy
in producing superior-quality 3D assets compared to existing methods. HomePage:
https://craftsman3d.github.io/, Code: https://github.com/wyysf-98/CraftsManSummary
AI-Generated Summary