Hash3D: Accelerazione senza addestramento per la generazione 3D

Abstract

L'evoluzione della modellazione generativa 3D è stata notevolmente accelerata dall'adozione di modelli di diffusione 2D. Nonostante questi progressi, il processo di ottimizzazione stesso rappresenta un ostacolo critico per l'efficienza. In questo articolo, introduciamo Hash3D, un metodo universale per accelerare la generazione 3D senza addestramento del modello. Il fulcro di Hash3D è l'intuizione che la ridondanza delle mappe di caratteristiche sia prevalente nelle immagini renderizzate da posizioni della camera e passaggi temporali di diffusione vicini. Hashing e riutilizzando efficacemente queste mappe di caratteristiche tra passaggi temporali e angoli di camera adiacenti, Hash3D previene sostanzialmente calcoli ridondanti, accelerando così l'inferenza del modello di diffusione nei compiti di generazione 3D. Raggiungiamo questo obiettivo attraverso un hashing adattivo basato su griglia. Sorprendentemente, questo meccanismo di condivisione delle caratteristiche non solo accelera la generazione, ma migliora anche la fluidità e la coerenza visiva degli oggetti 3D sintetizzati. I nostri esperimenti, che coprono 5 modelli da testo-a-3D e 3 da immagine-a-3D, dimostrano la versatilità di Hash3D nell'accelerare l'ottimizzazione, migliorando l'efficienza da 1,3 a 4 volte. Inoltre, l'integrazione di Hash3D con lo splatting Gaussiano 3D accelera notevolmente la creazione di modelli 3D, riducendo il tempo di elaborazione da testo-a-3D a circa 10 minuti e la conversione da immagine-a-3D a circa 30 secondi. La pagina del progetto è disponibile all'indirizzo https://adamdad.github.io/hash3D/.

English

The evolution of 3D generative modeling has been notably propelled by the adoption of 2D diffusion models. Despite this progress, the cumbersome optimization process per se presents a critical hurdle to efficiency. In this paper, we introduce Hash3D, a universal acceleration for 3D generation without model training. Central to Hash3D is the insight that feature-map redundancy is prevalent in images rendered from camera positions and diffusion time-steps in close proximity. By effectively hashing and reusing these feature maps across neighboring timesteps and camera angles, Hash3D substantially prevents redundant calculations, thus accelerating the diffusion model's inference in 3D generation tasks. We achieve this through an adaptive grid-based hashing. Surprisingly, this feature-sharing mechanism not only speed up the generation but also enhances the smoothness and view consistency of the synthesized 3D objects. Our experiments covering 5 text-to-3D and 3 image-to-3D models, demonstrate Hash3D's versatility to speed up optimization, enhancing efficiency by 1.3 to 4 times. Additionally, Hash3D's integration with 3D Gaussian splatting largely speeds up 3D model creation, reducing text-to-3D processing to about 10 minutes and image-to-3D conversion to roughly 30 seconds. The project page is at https://adamdad.github.io/hash3D/.

Hash3D: Accelerazione senza addestramento per la generazione 3D

Hash3D: Training-free Acceleration for 3D Generation

Abstract

Support