CraftsMan: Hochauflösende Gittergenerierung mit 3D-Native-Generierung und interaktivem Geometrie-Verfeinerer
CraftsMan: High-fidelity Mesh Generation with 3D Native Generation and Interactive Geometry Refiner
May 23, 2024
Autoren: Weiyu Li, Jiarui Liu, Rui Chen, Yixun Liang, Xuelin Chen, Ping Tan, Xiaoxiao Long
cs.AI
Zusammenfassung
Wir präsentieren ein neuartiges generatives 3D-Modellierungssystem namens CraftsMan, das hochwertige 3D-Geometrien mit stark variierenden Formen, regelmäßigen Netztopologien und detaillierten Oberflächen erzeugen kann und es ermöglicht, die Geometrie auf interaktive Weise zu verfeinern. Trotz der signifikanten Fortschritte bei der 3D-Generierung haben bestehende Methoden immer noch Schwierigkeiten mit langwierigen Optimierungsprozessen, unregelmäßigen Netztopologien, rauschenden Oberflächen und Problemen bei der Berücksichtigung von Benutzerbearbeitungen, was ihre weitreichende Übernahme und Implementierung in 3D-Modellierungssoftware behindert. Unsere Arbeit ist vom Handwerker inspiriert, der in der Regel zuerst die ganzheitliche Figur des Werks grob skizziert und anschließend die Oberflächendetails ausarbeitet. Speziell verwenden wir ein 3D-eigenes Diffusionsmodell, das im latenten Raum arbeitet, der aus latenzbasierten 3D-Repräsentationen gelernt wurde, um grobe Geometrien mit regelmäßiger Netztopologie in Sekunden zu generieren. Insbesondere nimmt dieser Prozess einen Textprompt oder ein Referenzbild als Eingabe und nutzt ein leistungsstarkes Multi-View (MV) Diffusionsmodell, um mehrere Ansichten der groben Geometrie zu generieren, die in unser MV-konditioniertes 3D-Diffusionsmodell eingespeist werden, um die 3D-Geometrie zu generieren und die Robustheit und Generalisierbarkeit signifikant zu verbessern. Anschließend wird ein geometrischer Verfeinerer auf Basis von Normalen verwendet, um die Oberflächendetails signifikant zu verbessern. Diese Verfeinerung kann automatisch oder interaktiv mit benutzerdefinierten Bearbeitungen durchgeführt werden. Umfangreiche Experimente zeigen, dass unsere Methode eine hohe Wirksamkeit bei der Erzeugung hochwertiger 3D-Assets im Vergleich zu bestehenden Methoden erreicht. Homepage: https://craftsman3d.github.io/, Code: https://github.com/wyysf-98/CraftsMan
English
We present a novel generative 3D modeling system, coined CraftsMan, which can
generate high-fidelity 3D geometries with highly varied shapes, regular mesh
topologies, and detailed surfaces, and, notably, allows for refining the
geometry in an interactive manner. Despite the significant advancements in 3D
generation, existing methods still struggle with lengthy optimization
processes, irregular mesh topologies, noisy surfaces, and difficulties in
accommodating user edits, consequently impeding their widespread adoption and
implementation in 3D modeling software. Our work is inspired by the craftsman,
who usually roughs out the holistic figure of the work first and elaborates the
surface details subsequently. Specifically, we employ a 3D native diffusion
model, which operates on latent space learned from latent set-based 3D
representations, to generate coarse geometries with regular mesh topology in
seconds. In particular, this process takes as input a text prompt or a
reference image and leverages a powerful multi-view (MV) diffusion model to
generate multiple views of the coarse geometry, which are fed into our
MV-conditioned 3D diffusion model for generating the 3D geometry, significantly
improving robustness and generalizability. Following that, a normal-based
geometry refiner is used to significantly enhance the surface details. This
refinement can be performed automatically, or interactively with user-supplied
edits. Extensive experiments demonstrate that our method achieves high efficacy
in producing superior-quality 3D assets compared to existing methods. HomePage:
https://craftsman3d.github.io/, Code: https://github.com/wyysf-98/CraftsManSummary
AI-Generated Summary