ChatPaper.aiChatPaper

AGG: Gaussianas Gerativas Amortizadas em 3D para Conversão de Imagem Única em 3D

AGG: Amortized Generative 3D Gaussians for Single Image to 3D

January 8, 2024
Autores: Dejia Xu, Ye Yuan, Morteza Mardani, Sifei Liu, Jiaming Song, Zhangyang Wang, Arash Vahdat
cs.AI

Resumo

Diante da crescente necessidade de pipelines automáticos de criação de conteúdo 3D, diversas representações 3D têm sido estudadas para gerar objetos 3D a partir de uma única imagem. Devido à sua eficiência superior em renderização, modelos baseados em *splatting* de Gaussianas 3D têm se destacado recentemente tanto na reconstrução quanto na geração de conteúdo 3D. Abordagens de *splatting* de Gaussianas 3D para geração de imagens em 3D são frequentemente baseadas em otimização, exigindo várias etapas computacionalmente custosas de destilação de pontuação. Para superar esses desafios, introduzimos um framework de Gaussianas 3D Generativo Amortizado (AGG, *Amortized Generative 3D Gaussian*) que produz instantaneamente Gaussianas 3D a partir de uma única imagem, eliminando a necessidade de otimização por instância. Utilizando uma representação híbrida intermediária, o AGG decompõe a geração de localizações de Gaussianas 3D e outros atributos de aparência para otimização conjunta. Além disso, propomos um pipeline em cascata que primeiro gera uma representação grosseira dos dados 3D e, posteriormente, a aprimora com um módulo de super-resolução de Gaussianas 3D. Nosso método é avaliado em comparação com frameworks de Gaussianas 3D baseados em otimização e pipelines baseados em amostragem que utilizam outras representações 3D, onde o AGG demonstra capacidades competitivas de geração tanto qualitativa quanto quantitativamente, sendo várias ordens de magnitude mais rápido. Página do projeto: https://ir1d.github.io/AGG/
English
Given the growing need for automatic 3D content creation pipelines, various 3D representations have been studied to generate 3D objects from a single image. Due to its superior rendering efficiency, 3D Gaussian splatting-based models have recently excelled in both 3D reconstruction and generation. 3D Gaussian splatting approaches for image to 3D generation are often optimization-based, requiring many computationally expensive score-distillation steps. To overcome these challenges, we introduce an Amortized Generative 3D Gaussian framework (AGG) that instantly produces 3D Gaussians from a single image, eliminating the need for per-instance optimization. Utilizing an intermediate hybrid representation, AGG decomposes the generation of 3D Gaussian locations and other appearance attributes for joint optimization. Moreover, we propose a cascaded pipeline that first generates a coarse representation of the 3D data and later upsamples it with a 3D Gaussian super-resolution module. Our method is evaluated against existing optimization-based 3D Gaussian frameworks and sampling-based pipelines utilizing other 3D representations, where AGG showcases competitive generation abilities both qualitatively and quantitatively while being several orders of magnitude faster. Project page: https://ir1d.github.io/AGG/
PDF91February 9, 2026