CraftsMan: Generación de mallas de alta fidelidad con creación nativa en 3D y refinador de geometría interactivo
CraftsMan: High-fidelity Mesh Generation with 3D Native Generation and Interactive Geometry Refiner
May 23, 2024
Autores: Weiyu Li, Jiarui Liu, Rui Chen, Yixun Liang, Xuelin Chen, Ping Tan, Xiaoxiao Long
cs.AI
Resumen
Presentamos un novedoso sistema generativo de modelado 3D, denominado CraftsMan, que puede generar geometrías 3D de alta fidelidad con formas muy variadas, topologías de malla regulares y superficies detalladas, y, notablemente, permite refinar la geometría de manera interactiva. A pesar de los avances significativos en la generación 3D, los métodos existentes aún enfrentan problemas con procesos de optimización prolongados, topologías de malla irregulares, superficies ruidosas y dificultades para incorporar ediciones de los usuarios, lo que obstaculiza su adopción generalizada e implementación en software de modelado 3D. Nuestro trabajo está inspirado en el artesano, quien generalmente esboza primero la figura holística de la obra y elabora los detalles de la superficie posteriormente. Específicamente, empleamos un modelo de difusión nativo 3D, que opera en un espacio latente aprendido a partir de representaciones 3D basadas en conjuntos latentes, para generar geometrías aproximadas con topología de malla regular en cuestión de segundos. En particular, este proceso toma como entrada un texto descriptivo o una imagen de referencia y aprovecha un potente modelo de difusión multi-vista (MV) para generar múltiples vistas de la geometría aproximada, las cuales se alimentan a nuestro modelo de difusión 3D condicionado por MV para generar la geometría 3D, mejorando significativamente la robustez y generalización. Posteriormente, se utiliza un refinador de geometría basado en normales para mejorar considerablemente los detalles de la superficie. Este refinamiento puede realizarse automáticamente o de manera interactiva con ediciones proporcionadas por el usuario. Experimentos extensos demuestran que nuestro método logra una alta eficacia en la producción de activos 3D de calidad superior en comparación con los métodos existentes. Página principal: https://craftsman3d.github.io/, Código: https://github.com/wyysf-98/CraftsMan.
English
We present a novel generative 3D modeling system, coined CraftsMan, which can
generate high-fidelity 3D geometries with highly varied shapes, regular mesh
topologies, and detailed surfaces, and, notably, allows for refining the
geometry in an interactive manner. Despite the significant advancements in 3D
generation, existing methods still struggle with lengthy optimization
processes, irregular mesh topologies, noisy surfaces, and difficulties in
accommodating user edits, consequently impeding their widespread adoption and
implementation in 3D modeling software. Our work is inspired by the craftsman,
who usually roughs out the holistic figure of the work first and elaborates the
surface details subsequently. Specifically, we employ a 3D native diffusion
model, which operates on latent space learned from latent set-based 3D
representations, to generate coarse geometries with regular mesh topology in
seconds. In particular, this process takes as input a text prompt or a
reference image and leverages a powerful multi-view (MV) diffusion model to
generate multiple views of the coarse geometry, which are fed into our
MV-conditioned 3D diffusion model for generating the 3D geometry, significantly
improving robustness and generalizability. Following that, a normal-based
geometry refiner is used to significantly enhance the surface details. This
refinement can be performed automatically, or interactively with user-supplied
edits. Extensive experiments demonstrate that our method achieves high efficacy
in producing superior-quality 3D assets compared to existing methods. HomePage:
https://craftsman3d.github.io/, Code: https://github.com/wyysf-98/CraftsMan