ChatPaper.aiChatPaper

WildGaussians : Projection de Gaussiennes 3D en environnement naturel

WildGaussians: 3D Gaussian Splatting in the Wild

July 11, 2024
Auteurs: Jonas Kulhanek, Songyou Peng, Zuzana Kukelova, Marc Pollefeys, Torsten Sattler
cs.AI

Résumé

Alors que le domaine de la reconstruction de scènes 3D est dominé par les NeRFs en raison de leur qualité photoréaliste, la méthode des 3D Gaussian Splatting (3DGS) a récemment émergé, offrant une qualité similaire avec des vitesses de rendu en temps réel. Cependant, ces deux méthodes excellent principalement avec des scènes 3D bien contrôlées, tandis que les données en conditions réelles - caractérisées par des occlusions, des objets dynamiques et des éclairages variables - restent difficiles à traiter. Les NeRFs peuvent s'adapter facilement à ces conditions grâce à des vecteurs d'incorporation par image, mais la 3DGS peine en raison de sa représentation explicite et de l'absence de paramètres partagés. Pour résoudre ce problème, nous introduisons WildGaussians, une nouvelle approche pour gérer les occlusions et les variations d'apparence avec la 3DGS. En exploitant des caractéristiques robustes de DINO et en intégrant un module de modélisation de l'apparence au sein de la 3DGS, notre méthode obtient des résultats de pointe. Nous démontrons que WildGaussians atteint la vitesse de rendu en temps réel de la 3DGS tout en surpassant à la fois les bases de référence de la 3DGS et des NeRFs dans le traitement des données en conditions réelles, le tout dans un cadre architectural simple.
English
While the field of 3D scene reconstruction is dominated by NeRFs due to their photorealistic quality, 3D Gaussian Splatting (3DGS) has recently emerged, offering similar quality with real-time rendering speeds. However, both methods primarily excel with well-controlled 3D scenes, while in-the-wild data - characterized by occlusions, dynamic objects, and varying illumination - remains challenging. NeRFs can adapt to such conditions easily through per-image embedding vectors, but 3DGS struggles due to its explicit representation and lack of shared parameters. To address this, we introduce WildGaussians, a novel approach to handle occlusions and appearance changes with 3DGS. By leveraging robust DINO features and integrating an appearance modeling module within 3DGS, our method achieves state-of-the-art results. We demonstrate that WildGaussians matches the real-time rendering speed of 3DGS while surpassing both 3DGS and NeRF baselines in handling in-the-wild data, all within a simple architectural framework.

Summary

AI-Generated Summary

PDF102November 28, 2024