ChatPaper.aiChatPaper

AGG: Geamortiseerde Generatieve 3D Gaussians voor Single Image naar 3D

AGG: Amortized Generative 3D Gaussians for Single Image to 3D

January 8, 2024
Auteurs: Dejia Xu, Ye Yuan, Morteza Mardani, Sifei Liu, Jiaming Song, Zhangyang Wang, Arash Vahdat
cs.AI

Samenvatting

Gezien de groeiende behoefte aan automatische 3D-contentcreatiepijplijnen, zijn verschillende 3D-representaties bestudeerd om 3D-objecten uit een enkele afbeelding te genereren. Vanwege de superieure renderingefficiëntie hebben op 3D Gaussian splatting gebaseerde modellen recentelijk uitstekende prestaties geleverd in zowel 3D-reconstructie als -generatie. Benaderingen voor 3D Gaussian splatting voor beeld-naar-3D-generatie zijn vaak optimalisatiegebaseerd, wat veel rekenkundig dure score-distillatiestappen vereist. Om deze uitdagingen te overwinnen, introduceren we een Amortized Generative 3D Gaussian-framework (AGG) dat onmiddellijk 3D Gaussians produceert uit een enkele afbeelding, waardoor de noodzaak voor per-instantie optimalisatie wordt geëlimineerd. Door gebruik te maken van een intermediaire hybride representatie, ontbindt AGG de generatie van 3D Gaussian-locaties en andere uiterlijke attributen voor gezamenlijke optimalisatie. Bovendien stellen we een gecascadeerde pijplijn voor die eerst een grove representatie van de 3D-gegevens genereert en deze later upsamplet met een 3D Gaussian super-resolutiemodule. Onze methode wordt geëvalueerd tegen bestaande optimalisatiegebaseerde 3D Gaussian-frameworks en samplinggebaseerde pijplijnen die andere 3D-representaties gebruiken, waarbij AGG competitieve generatiecapaciteiten laat zien, zowel kwalitatief als kwantitatief, terwijl het meerdere ordes van grootte sneller is. Projectpagina: https://ir1d.github.io/AGG/
English
Given the growing need for automatic 3D content creation pipelines, various 3D representations have been studied to generate 3D objects from a single image. Due to its superior rendering efficiency, 3D Gaussian splatting-based models have recently excelled in both 3D reconstruction and generation. 3D Gaussian splatting approaches for image to 3D generation are often optimization-based, requiring many computationally expensive score-distillation steps. To overcome these challenges, we introduce an Amortized Generative 3D Gaussian framework (AGG) that instantly produces 3D Gaussians from a single image, eliminating the need for per-instance optimization. Utilizing an intermediate hybrid representation, AGG decomposes the generation of 3D Gaussian locations and other appearance attributes for joint optimization. Moreover, we propose a cascaded pipeline that first generates a coarse representation of the 3D data and later upsamples it with a 3D Gaussian super-resolution module. Our method is evaluated against existing optimization-based 3D Gaussian frameworks and sampling-based pipelines utilizing other 3D representations, where AGG showcases competitive generation abilities both qualitatively and quantitatively while being several orders of magnitude faster. Project page: https://ir1d.github.io/AGG/
PDF91February 9, 2026