WildGaussians: Splatting con Gaussiane 3D in Ambienti Non Controllati
WildGaussians: 3D Gaussian Splatting in the Wild
July 11, 2024
Autori: Jonas Kulhanek, Songyou Peng, Zuzana Kukelova, Marc Pollefeys, Torsten Sattler
cs.AI
Abstract
Mentre il campo della ricostruzione di scene 3D è dominato dalle NeRF grazie alla loro qualità fotorealistica, il 3D Gaussian Splatting (3DGS) è emerso recentemente, offrendo una qualità simile con velocità di rendering in tempo reale. Tuttavia, entrambi i metodi eccellono principalmente con scene 3D ben controllate, mentre i dati in condizioni reali - caratterizzati da occlusioni, oggetti dinamici e illuminazione variabile - rimangono una sfida. Le NeRF possono adattarsi facilmente a tali condizioni attraverso vettori di embedding per immagine, ma il 3DGS fatica a causa della sua rappresentazione esplicita e della mancanza di parametri condivisi. Per affrontare questo problema, introduciamo WildGaussians, un approccio innovativo per gestire occlusioni e cambiamenti di aspetto con il 3DGS. Sfruttando robuste caratteristiche DINO e integrando un modulo di modellazione dell'aspetto all'interno del 3DGS, il nostro metodo raggiunge risultati all'avanguardia. Dimostriamo che WildGaussians eguaglia la velocità di rendering in tempo reale del 3DGS superando sia il 3DGS che le baseline NeRF nella gestione di dati in condizioni reali, il tutto all'interno di un framework architetturale semplice.
English
While the field of 3D scene reconstruction is dominated by NeRFs due to their
photorealistic quality, 3D Gaussian Splatting (3DGS) has recently emerged,
offering similar quality with real-time rendering speeds. However, both methods
primarily excel with well-controlled 3D scenes, while in-the-wild data -
characterized by occlusions, dynamic objects, and varying illumination -
remains challenging. NeRFs can adapt to such conditions easily through
per-image embedding vectors, but 3DGS struggles due to its explicit
representation and lack of shared parameters. To address this, we introduce
WildGaussians, a novel approach to handle occlusions and appearance changes
with 3DGS. By leveraging robust DINO features and integrating an appearance
modeling module within 3DGS, our method achieves state-of-the-art results. We
demonstrate that WildGaussians matches the real-time rendering speed of 3DGS
while surpassing both 3DGS and NeRF baselines in handling in-the-wild data, all
within a simple architectural framework.