ChatPaper.aiChatPaper

BANG: Divisão de Ativos 3D por meio de Dinâmicas Explodidas Gerativas

BANG: Dividing 3D Assets via Generative Exploded Dynamics

July 29, 2025
Autores: Longwen Zhang, Qixuan Zhang, Haoran Jiang, Yinuo Bai, Wei Yang, Lan Xu, Jingyi Yu
cs.AI

Resumo

A criação 3D sempre foi uma habilidade única dos seres humanos, impulsionada pela nossa capacidade de desconstruir e remontar objetos usando nossos olhos, mente e mãos. No entanto, as ferramentas atuais de design 3D têm dificuldade em replicar esse processo natural, exigindo considerável expertise artística e trabalho manual. Este artigo apresenta o BANG, uma nova abordagem generativa que conecta a geração 3D ao raciocínio, permitindo uma decomposição intuitiva e flexível de objetos 3D em nível de partes. No cerne do BANG está a "Dinâmica Explodida Generativa", que cria uma sequência suave de estados explodidos para uma geometria de entrada, separando progressivamente as partes enquanto preserva sua coerência geométrica e semântica. O BANG utiliza um modelo de difusão latente em larga escala pré-treinado, ajustado para dinâmica explodida com um adaptador leve de vista explodida, permitindo controle preciso sobre o processo de decomposição. Ele também incorpora um módulo de atenção temporal para garantir transições suaves e consistência ao longo do tempo. O BANG aprimora o controle com prompts espaciais, como caixas delimitadoras e regiões de superfície, permitindo que os usuários especifiquem quais partes decompor e como. Essa interação pode ser estendida com modelos multimodais como o GPT-4, possibilitando manipulações 2D-para-3D para fluxos de trabalho mais intuitivos e criativos. As capacidades do BANG se estendem à geração de geometrias detalhadas em nível de partes, associação de partes com descrições funcionais e facilitação de fluxos de trabalho de criação e manufatura 3D conscientes dos componentes. Além disso, o BANG oferece aplicações em impressão 3D, onde partes separáveis são geradas para fácil impressão e remontagem. Em essência, o BANG permite uma transformação contínua de conceitos imaginativos para ativos 3D detalhados, oferecendo uma nova perspectiva sobre a criação que ressoa com a intuição humana.
English
3D creation has always been a unique human strength, driven by our ability to deconstruct and reassemble objects using our eyes, mind and hand. However, current 3D design tools struggle to replicate this natural process, requiring considerable artistic expertise and manual labor. This paper introduces BANG, a novel generative approach that bridges 3D generation and reasoning, allowing for intuitive and flexible part-level decomposition of 3D objects. At the heart of BANG is "Generative Exploded Dynamics", which creates a smooth sequence of exploded states for an input geometry, progressively separating parts while preserving their geometric and semantic coherence. BANG utilizes a pre-trained large-scale latent diffusion model, fine-tuned for exploded dynamics with a lightweight exploded view adapter, allowing precise control over the decomposition process. It also incorporates a temporal attention module to ensure smooth transitions and consistency across time. BANG enhances control with spatial prompts, such as bounding boxes and surface regions, enabling users to specify which parts to decompose and how. This interaction can be extended with multimodal models like GPT-4, enabling 2D-to-3D manipulations for more intuitive and creative workflows. The capabilities of BANG extend to generating detailed part-level geometry, associating parts with functional descriptions, and facilitating component-aware 3D creation and manufacturing workflows. Additionally, BANG offers applications in 3D printing, where separable parts are generated for easy printing and reassembly. In essence, BANG enables seamless transformation from imaginative concepts to detailed 3D assets, offering a new perspective on creation that resonates with human intuition.
PDF623July 31, 2025