ChatPaper.aiChatPaper

BANG: Het verdelen van 3D-assets via generatieve geëxplodeerde dynamiek

BANG: Dividing 3D Assets via Generative Exploded Dynamics

July 29, 2025
Auteurs: Longwen Zhang, Qixuan Zhang, Haoran Jiang, Yinuo Bai, Wei Yang, Lan Xu, Jingyi Yu
cs.AI

Samenvatting

3D-creatie is altijd een unieke menselijke kracht geweest, aangedreven door ons vermogen om objecten te deconstrueren en weer samen te stellen met behulp van onze ogen, geest en handen. Huidige 3D-ontwerptools hebben echter moeite om dit natuurlijke proces na te bootsen, omdat ze aanzienlijke artistieke expertise en handmatig werk vereisen. Dit artikel introduceert BANG, een nieuwe generatieve aanpak die 3D-generatie en redenering verbindt, waardoor een intuïtieve en flexibele decompositie van 3D-objecten op onderdeelniveau mogelijk wordt. De kern van BANG is "Generative Exploded Dynamics", dat een vloeiende reeks geëxplodeerde toestanden creëert voor een ingevoerde geometrie, waarbij onderdelen geleidelijk worden gescheiden terwijl hun geometrische en semantische samenhang behouden blijft. BANG maakt gebruik van een vooraf getraind latent diffusiemodel op grote schaal, dat is afgestemd op geëxplodeerde dynamiek met een lichtgewicht geëxplodeerde weergave-adapter, waardoor nauwkeurige controle over het decompositieproces mogelijk is. Het bevat ook een temporele aandachtmodule om vloeiende overgangen en consistentie in de tijd te waarborgen. BANG verbetert de controle met ruimtelijke prompts, zoals begrenzingsvakken en oppervlaktegebieden, waardoor gebruikers kunnen specificeren welke onderdelen moeten worden gedecentreerd en hoe. Deze interactie kan worden uitgebreid met multimodale modellen zoals GPT-4, waardoor 2D-naar-3D-manipulaties mogelijk worden voor meer intuïtieve en creatieve workflows. De mogelijkheden van BANG strekken zich uit tot het genereren van gedetailleerde geometrie op onderdeelniveau, het koppelen van onderdelen aan functionele beschrijvingen, en het faciliteren van componentbewuste 3D-creatie en productieworkflows. Daarnaast biedt BANG toepassingen in 3D-printen, waarbij scheidbare onderdelen worden gegenereerd voor eenvoudig printen en opnieuw samenstellen. In essentie maakt BANG een naadloze transformatie mogelijk van creatieve concepten naar gedetailleerde 3D-assets, en biedt het een nieuw perspectief op creatie dat aansluit bij de menselijke intuïtie.
English
3D creation has always been a unique human strength, driven by our ability to deconstruct and reassemble objects using our eyes, mind and hand. However, current 3D design tools struggle to replicate this natural process, requiring considerable artistic expertise and manual labor. This paper introduces BANG, a novel generative approach that bridges 3D generation and reasoning, allowing for intuitive and flexible part-level decomposition of 3D objects. At the heart of BANG is "Generative Exploded Dynamics", which creates a smooth sequence of exploded states for an input geometry, progressively separating parts while preserving their geometric and semantic coherence. BANG utilizes a pre-trained large-scale latent diffusion model, fine-tuned for exploded dynamics with a lightweight exploded view adapter, allowing precise control over the decomposition process. It also incorporates a temporal attention module to ensure smooth transitions and consistency across time. BANG enhances control with spatial prompts, such as bounding boxes and surface regions, enabling users to specify which parts to decompose and how. This interaction can be extended with multimodal models like GPT-4, enabling 2D-to-3D manipulations for more intuitive and creative workflows. The capabilities of BANG extend to generating detailed part-level geometry, associating parts with functional descriptions, and facilitating component-aware 3D creation and manufacturing workflows. Additionally, BANG offers applications in 3D printing, where separable parts are generated for easy printing and reassembly. In essence, BANG enables seamless transformation from imaginative concepts to detailed 3D assets, offering a new perspective on creation that resonates with human intuition.
PDF593July 31, 2025