ChatPaper.aiChatPaper

GaussianSR: Super-resolução 3D com Gaussianas utilizando Priors de Difusão 2D

GaussianSR: 3D Gaussian Super-Resolution with 2D Diffusion Priors

June 14, 2024
Autores: Xiqian Yu, Hanxin Zhu, Tianyu He, Zhibo Chen
cs.AI

Resumo

A obtenção de síntese de novas visões de alta resolução (HRNVS) a partir de visões de entrada de baixa resolução é uma tarefa desafiadora devido à falta de dados de alta resolução. Métodos anteriores otimizam campos de radiação neural (NeRF) de alta resolução a partir de visões de entrada de baixa resolução, mas sofrem com uma velocidade de renderização lenta. Neste trabalho, baseamos nosso método no Splatting Gaussiano 3D (3DGS) devido à sua capacidade de produzir imagens de alta qualidade com uma velocidade de renderização mais rápida. Para aliviar a escassez de dados para síntese de resolução mais alta, propomos aproveitar priors de difusão 2D prontamente disponíveis, destilando o conhecimento 2D em 3D com Amostragem de Destilação de Pontuação (SDS). No entanto, aplicar SDS diretamente à super-resolução 3D baseada em Gaussianos leva a primitivos Gaussianos 3D indesejáveis e redundantes, devido à aleatoriedade trazida pelos priors generativos. Para mitigar esse problema, introduzimos duas técnicas simples, mas eficazes, para reduzir as perturbações estocásticas introduzidas pelo SDS. Especificamente, 1) reduzimos o intervalo do passo de tempo de difusão no SDS com uma estratégia de recozimento; 2) descartamos aleatoriamente primitivos Gaussianos redundantes durante a densificação. Experimentos extensivos demonstraram que nosso GaussainSR proposto pode alcançar resultados de alta qualidade para HRNVS com apenas entradas de baixa resolução em conjuntos de dados sintéticos e do mundo real. Página do projeto: https://chchnii.github.io/GaussianSR/
English
Achieving high-resolution novel view synthesis (HRNVS) from low-resolution input views is a challenging task due to the lack of high-resolution data. Previous methods optimize high-resolution Neural Radiance Field (NeRF) from low-resolution input views but suffer from slow rendering speed. In this work, we base our method on 3D Gaussian Splatting (3DGS) due to its capability of producing high-quality images at a faster rendering speed. To alleviate the shortage of data for higher-resolution synthesis, we propose to leverage off-the-shelf 2D diffusion priors by distilling the 2D knowledge into 3D with Score Distillation Sampling (SDS). Nevertheless, applying SDS directly to Gaussian-based 3D super-resolution leads to undesirable and redundant 3D Gaussian primitives, due to the randomness brought by generative priors. To mitigate this issue, we introduce two simple yet effective techniques to reduce stochastic disturbances introduced by SDS. Specifically, we 1) shrink the range of diffusion timestep in SDS with an annealing strategy; 2) randomly discard redundant Gaussian primitives during densification. Extensive experiments have demonstrated that our proposed GaussainSR can attain high-quality results for HRNVS with only low-resolution inputs on both synthetic and real-world datasets. Project page: https://chchnii.github.io/GaussianSR/
PDF62December 6, 2024