Gaussianos Selvagens: Splatting Gaussiano em 3D na Natureza
WildGaussians: 3D Gaussian Splatting in the Wild
July 11, 2024
Autores: Jonas Kulhanek, Songyou Peng, Zuzana Kukelova, Marc Pollefeys, Torsten Sattler
cs.AI
Resumo
Embora o campo da reconstrução de cenas 3D seja dominado pelos NeRFs devido à sua qualidade fotorrealística, o Splatting Gaussiano 3D (3DGS) surgiu recentemente, oferecendo qualidade semelhante com velocidades de renderização em tempo real. No entanto, ambos os métodos se destacam principalmente em cenas 3D bem controladas, enquanto dados em ambientes naturais - caracterizados por oclusões, objetos dinâmicos e iluminação variável - continuam sendo um desafio. Os NeRFs podem se adaptar facilmente a essas condições por meio de vetores de incorporação por imagem, mas o 3DGS enfrenta dificuldades devido à sua representação explícita e falta de parâmetros compartilhados. Para lidar com isso, introduzimos os WildGaussians, uma abordagem inovadora para lidar com oclusões e mudanças de aparência com o 3DGS. Ao alavancar recursos robustos do DINO e integrar um módulo de modelagem de aparência dentro do 3DGS, nosso método alcança resultados de ponta. Demonstramos que os WildGaussians igualam a velocidade de renderização em tempo real do 3DGS, enquanto superam tanto o 3DGS quanto os NeRFs em lidar com dados em ambientes naturais, tudo dentro de uma estrutura arquitetônica simples.
English
While the field of 3D scene reconstruction is dominated by NeRFs due to their
photorealistic quality, 3D Gaussian Splatting (3DGS) has recently emerged,
offering similar quality with real-time rendering speeds. However, both methods
primarily excel with well-controlled 3D scenes, while in-the-wild data -
characterized by occlusions, dynamic objects, and varying illumination -
remains challenging. NeRFs can adapt to such conditions easily through
per-image embedding vectors, but 3DGS struggles due to its explicit
representation and lack of shared parameters. To address this, we introduce
WildGaussians, a novel approach to handle occlusions and appearance changes
with 3DGS. By leveraging robust DINO features and integrating an appearance
modeling module within 3DGS, our method achieves state-of-the-art results. We
demonstrate that WildGaussians matches the real-time rendering speed of 3DGS
while surpassing both 3DGS and NeRF baselines in handling in-the-wild data, all
within a simple architectural framework.