BANG: División de Activos 3D mediante Dinámica Generativa de Explosión
BANG: Dividing 3D Assets via Generative Exploded Dynamics
July 29, 2025
Autores: Longwen Zhang, Qixuan Zhang, Haoran Jiang, Yinuo Bai, Wei Yang, Lan Xu, Jingyi Yu
cs.AI
Resumen
La creación en 3D siempre ha sido una fortaleza única del ser humano, impulsada por nuestra capacidad para deconstruir y reensamblar objetos utilizando nuestros ojos, mente y manos. Sin embargo, las herramientas actuales de diseño 3D tienen dificultades para replicar este proceso natural, requiriendo un considerable expertise artístico y trabajo manual. Este artículo presenta BANG, un enfoque generativo novedoso que conecta la generación 3D con el razonamiento, permitiendo una descomposición intuitiva y flexible de objetos 3D a nivel de partes. En el núcleo de BANG se encuentra la "Dinámica Generativa Explosionada", que crea una secuencia fluida de estados explosionados para una geometría de entrada, separando progresivamente las partes mientras preserva su coherencia geométrica y semántica.
BANG utiliza un modelo de difusión latente a gran escala preentrenado, ajustado para la dinámica explosionada con un adaptador ligero de vistas explosionadas, permitiendo un control preciso sobre el proceso de descomposición. También incorpora un módulo de atención temporal para garantizar transiciones suaves y consistencia a lo largo del tiempo. BANG mejora el control con indicaciones espaciales, como cajas delimitadoras y regiones de superficie, permitiendo a los usuarios especificar qué partes descomponer y cómo. Esta interacción puede extenderse con modelos multimodales como GPT-4, habilitando manipulaciones de 2D a 3D para flujos de trabajo más intuitivos y creativos.
Las capacidades de BANG se extienden a la generación de geometrías detalladas a nivel de partes, la asociación de partes con descripciones funcionales, y la facilitación de flujos de trabajo de creación y fabricación 3D conscientes de los componentes. Además, BANG ofrece aplicaciones en la impresión 3D, donde se generan partes separables para facilitar la impresión y el reensamblaje. En esencia, BANG permite una transformación fluida desde conceptos imaginativos hasta activos 3D detallados, ofreciendo una nueva perspectiva sobre la creación que resuena con la intuición humana.
English
3D creation has always been a unique human strength, driven by our ability to
deconstruct and reassemble objects using our eyes, mind and hand. However,
current 3D design tools struggle to replicate this natural process, requiring
considerable artistic expertise and manual labor. This paper introduces BANG, a
novel generative approach that bridges 3D generation and reasoning, allowing
for intuitive and flexible part-level decomposition of 3D objects. At the heart
of BANG is "Generative Exploded Dynamics", which creates a smooth sequence of
exploded states for an input geometry, progressively separating parts while
preserving their geometric and semantic coherence.
BANG utilizes a pre-trained large-scale latent diffusion model, fine-tuned
for exploded dynamics with a lightweight exploded view adapter, allowing
precise control over the decomposition process. It also incorporates a temporal
attention module to ensure smooth transitions and consistency across time. BANG
enhances control with spatial prompts, such as bounding boxes and surface
regions, enabling users to specify which parts to decompose and how. This
interaction can be extended with multimodal models like GPT-4, enabling
2D-to-3D manipulations for more intuitive and creative workflows.
The capabilities of BANG extend to generating detailed part-level geometry,
associating parts with functional descriptions, and facilitating
component-aware 3D creation and manufacturing workflows. Additionally, BANG
offers applications in 3D printing, where separable parts are generated for
easy printing and reassembly. In essence, BANG enables seamless transformation
from imaginative concepts to detailed 3D assets, offering a new perspective on
creation that resonates with human intuition.