ChatPaper.aiChatPaper

VastGaussian : Vastes Gaussiennes 3D pour la reconstruction de scènes étendues

VastGaussian: Vast 3D Gaussians for Large Scene Reconstruction

February 27, 2024
Auteurs: Jiaqi Lin, Zhihao Li, Xiao Tang, Jianzhuang Liu, Shiyong Liu, Jiayue Liu, Yangdi Lu, Xiaofei Wu, Songcen Xu, Youliang Yan, Wenming Yang
cs.AI

Résumé

Les méthodes existantes basées sur NeRF pour la reconstruction de grandes scènes présentent souvent des limitations en termes de qualité visuelle et de vitesse de rendu. Bien que la récente technique de 3D Gaussian Splatting fonctionne bien pour les scènes de petite échelle et centrées sur des objets, son extension à de grandes scènes pose des défis en raison de la mémoire vidéo limitée, des temps d'optimisation longs et des variations d'apparence notables. Pour relever ces défis, nous présentons VastGaussian, la première méthode permettant une reconstruction de haute qualité et un rendu en temps réel pour les grandes scènes, basée sur le 3D Gaussian Splatting. Nous proposons une stratégie de partitionnement progressive pour diviser une grande scène en plusieurs cellules, où les caméras d'entraînement et le nuage de points sont correctement distribués selon un critère de visibilité prenant en compte l'espace aérien. Ces cellules sont ensuite fusionnées en une scène complète après une optimisation parallèle. Nous intégrons également une modélisation d'apparence découplée dans le processus d'optimisation pour réduire les variations d'apparence dans les images rendues. Notre approche surpasse les méthodes existantes basées sur NeRF et obtient des résultats de pointe sur plusieurs ensembles de données de grandes scènes, permettant une optimisation rapide et un rendu en temps réel de haute fidélité.
English
Existing NeRF-based methods for large scene reconstruction often have limitations in visual quality and rendering speed. While the recent 3D Gaussian Splatting works well on small-scale and object-centric scenes, scaling it up to large scenes poses challenges due to limited video memory, long optimization time, and noticeable appearance variations. To address these challenges, we present VastGaussian, the first method for high-quality reconstruction and real-time rendering on large scenes based on 3D Gaussian Splatting. We propose a progressive partitioning strategy to divide a large scene into multiple cells, where the training cameras and point cloud are properly distributed with an airspace-aware visibility criterion. These cells are merged into a complete scene after parallel optimization. We also introduce decoupled appearance modeling into the optimization process to reduce appearance variations in the rendered images. Our approach outperforms existing NeRF-based methods and achieves state-of-the-art results on multiple large scene datasets, enabling fast optimization and high-fidelity real-time rendering.
PDF1145December 15, 2024