CraftsMan: Geração de Malhas de Alta Fidelidade com Geração Nativa 3D e Refinador de Geometria Interativo
CraftsMan: High-fidelity Mesh Generation with 3D Native Generation and Interactive Geometry Refiner
May 23, 2024
Autores: Weiyu Li, Jiarui Liu, Rui Chen, Yixun Liang, Xuelin Chen, Ping Tan, Xiaoxiao Long
cs.AI
Resumo
Apresentamos um novo sistema de modelagem 3D generativo, denominado CraftsMan, que pode gerar geometrias 3D de alta fidelidade com formas altamente variadas, topologias de malha regulares e superfícies detalhadas, e, notavelmente, permite refinar a geometria de maneira interativa. Apesar dos avanços significativos na geração 3D, os métodos existentes ainda enfrentam desafios com processos de otimização demorados, topologias de malha irregulares, superfícies ruidosas e dificuldades em acomodar edições do usuário, consequentemente impedindo sua adoção generalizada e implementação em softwares de modelagem 3D. Nosso trabalho é inspirado no artesão, que geralmente esboça a figura holística da obra primeiro e elabora os detalhes da superfície posteriormente. Especificamente, empregamos um modelo de difusão 3D nativo, que opera em um espaço latente aprendido a partir de representações 3D baseadas em conjuntos latentes, para gerar geometrias grosseiras com topologia de malha regular em segundos. Em particular, esse processo recebe como entrada um prompt de texto ou uma imagem de referência e aproveita um poderoso modelo de difusão multi-visão (MV) para gerar múltiplas visões da geometria grosseira, que são alimentadas em nosso modelo de difusão 3D condicionado por MV para gerar a geometria 3D, melhorando significativamente a robustez e a generalização. Em seguida, um refinador de geometria baseado em normais é usado para aprimorar significativamente os detalhes da superfície. Esse refinamento pode ser realizado automaticamente ou de forma interativa com edições fornecidas pelo usuário. Experimentos extensivos demonstram que nosso método alcança alta eficácia na produção de ativos 3D de qualidade superior em comparação com os métodos existentes. Página inicial: https://craftsman3d.github.io/, Código: https://github.com/wyysf-98/CraftsMan
English
We present a novel generative 3D modeling system, coined CraftsMan, which can
generate high-fidelity 3D geometries with highly varied shapes, regular mesh
topologies, and detailed surfaces, and, notably, allows for refining the
geometry in an interactive manner. Despite the significant advancements in 3D
generation, existing methods still struggle with lengthy optimization
processes, irregular mesh topologies, noisy surfaces, and difficulties in
accommodating user edits, consequently impeding their widespread adoption and
implementation in 3D modeling software. Our work is inspired by the craftsman,
who usually roughs out the holistic figure of the work first and elaborates the
surface details subsequently. Specifically, we employ a 3D native diffusion
model, which operates on latent space learned from latent set-based 3D
representations, to generate coarse geometries with regular mesh topology in
seconds. In particular, this process takes as input a text prompt or a
reference image and leverages a powerful multi-view (MV) diffusion model to
generate multiple views of the coarse geometry, which are fed into our
MV-conditioned 3D diffusion model for generating the 3D geometry, significantly
improving robustness and generalizability. Following that, a normal-based
geometry refiner is used to significantly enhance the surface details. This
refinement can be performed automatically, or interactively with user-supplied
edits. Extensive experiments demonstrate that our method achieves high efficacy
in producing superior-quality 3D assets compared to existing methods. HomePage:
https://craftsman3d.github.io/, Code: https://github.com/wyysf-98/CraftsMan