ChatPaper.aiChatPaper

GaussianObject : Obtenir un objet 3D de haute qualité avec seulement quatre images grâce au Gaussian Splatting

GaussianObject: Just Taking Four Images to Get A High-Quality 3D Object with Gaussian Splatting

February 15, 2024
Auteurs: Chen Yang, Sikuang Li, Jiemin Fang, Ruofan Liang, Lingxi Xie, Xiaopeng Zhang, Wei Shen, Qi Tian
cs.AI

Résumé

La reconstruction et le rendu d'objets 3D à partir de vues très éparses revêt une importance cruciale pour promouvoir les applications des techniques de vision 3D et améliorer l'expérience utilisateur. Cependant, les images provenant de vues éparses ne contiennent qu'une quantité très limitée d'informations 3D, ce qui pose deux défis majeurs : 1) La difficulté à établir une cohérence multi-vues, car les images disponibles pour l'appariement sont trop peu nombreuses ; 2) Des informations partielles omises ou fortement compressées sur l'objet, en raison d'une couverture de vues insuffisante. Pour relever ces défis, nous proposons GaussianObject, un cadre de représentation et de rendu d'objets 3D utilisant le splatting de Gaussiennes, qui atteint une qualité de rendu élevée avec seulement 4 images en entrée. Nous introduisons d'abord des techniques de coque visuelle et d'élimination des flotteurs, qui injectent explicitement des a priori structurels dans le processus d'optimisation initial pour aider à établir la cohérence multi-vues, produisant ainsi une représentation grossière en Gaussiennes 3D. Ensuite, nous construisons un modèle de réparation basé sur des modèles de diffusion pour compléter les informations manquantes sur l'objet, où les Gaussiennes sont ensuite affinées. Nous concevons une stratégie d'auto-génération pour obtenir des paires d'images afin d'entraîner le modèle de réparation. Notre méthode GaussianObject est évaluée sur plusieurs ensembles de données complexes, notamment MipNeRF360, OmniObject3D et OpenIllumination, obtenant des résultats de reconstruction solides à partir de seulement 4 vues et surpassant significativement les méthodes précédentes de l'état de l'art.
English
Reconstructing and rendering 3D objects from highly sparse views is of critical importance for promoting applications of 3D vision techniques and improving user experience. However, images from sparse views only contain very limited 3D information, leading to two significant challenges: 1) Difficulty in building multi-view consistency as images for matching are too few; 2) Partially omitted or highly compressed object information as view coverage is insufficient. To tackle these challenges, we propose GaussianObject, a framework to represent and render the 3D object with Gaussian splatting, that achieves high rendering quality with only 4 input images. We first introduce techniques of visual hull and floater elimination which explicitly inject structure priors into the initial optimization process for helping build multi-view consistency, yielding a coarse 3D Gaussian representation. Then we construct a Gaussian repair model based on diffusion models to supplement the omitted object information, where Gaussians are further refined. We design a self-generating strategy to obtain image pairs for training the repair model. Our GaussianObject is evaluated on several challenging datasets, including MipNeRF360, OmniObject3D, and OpenIllumination, achieving strong reconstruction results from only 4 views and significantly outperforming previous state-of-the-art methods.

Summary

AI-Generated Summary

PDF164December 15, 2024