ChatPaper.aiChatPaper

GaussianObject: Nur vier Bilder benötigt, um ein hochwertiges 3D-Objekt mit Gaussian Splatting zu erstellen

GaussianObject: Just Taking Four Images to Get A High-Quality 3D Object with Gaussian Splatting

February 15, 2024
Autoren: Chen Yang, Sikuang Li, Jiemin Fang, Ruofan Liang, Lingxi Xie, Xiaopeng Zhang, Wei Shen, Qi Tian
cs.AI

Zusammenfassung

Die Rekonstruktion und Darstellung von 3D-Objekten aus stark spärlichen Ansichten ist von entscheidender Bedeutung, um Anwendungen von 3D-Vision-Techniken zu fördern und das Benutzererlebnis zu verbessern. Bilder aus spärlichen Ansichten enthalten jedoch nur sehr begrenzte 3D-Informationen, was zu zwei wesentlichen Herausforderungen führt: 1) Schwierigkeiten beim Aufbau von Multi-View-Konsistenz, da zu wenige Bilder für den Abgleich vorhanden sind; 2) Teilweise ausgelassene oder stark komprimierte Objektinformationen, da die Abdeckung der Ansichten unzureichend ist. Um diese Herausforderungen zu bewältigen, schlagen wir GaussianObject vor, ein Framework zur Darstellung und Darstellung des 3D-Objekts mit Gaussian Splatting, das eine hohe Darstellungsqualität mit nur 4 Eingabebildern erreicht. Wir führen zunächst Techniken des Visual Hull und der Floater-Eliminierung ein, die explizit Strukturpriors in den initialen Optimierungsprozess einbringen, um den Aufbau von Multi-View-Konsistenz zu unterstützen und eine grobe 3D-Gauß-Darstellung zu erzeugen. Anschließend konstruieren wir ein Gauß-Reparaturmodell basierend auf Diffusionsmodellen, um die ausgelassenen Objektinformationen zu ergänzen, wobei die Gauß-Funktionen weiter verfeinert werden. Wir entwerfen eine selbstgenerierende Strategie, um Bildpaare für das Training des Reparaturmodells zu erhalten. Unser GaussianObject wird auf mehreren anspruchsvollen Datensätzen evaluiert, darunter MipNeRF360, OmniObject3D und OpenIllumination, und erzielt starke Rekonstruktionsergebnisse aus nur 4 Ansichten, wobei es bisherige state-of-the-art-Methoden deutlich übertrifft.
English
Reconstructing and rendering 3D objects from highly sparse views is of critical importance for promoting applications of 3D vision techniques and improving user experience. However, images from sparse views only contain very limited 3D information, leading to two significant challenges: 1) Difficulty in building multi-view consistency as images for matching are too few; 2) Partially omitted or highly compressed object information as view coverage is insufficient. To tackle these challenges, we propose GaussianObject, a framework to represent and render the 3D object with Gaussian splatting, that achieves high rendering quality with only 4 input images. We first introduce techniques of visual hull and floater elimination which explicitly inject structure priors into the initial optimization process for helping build multi-view consistency, yielding a coarse 3D Gaussian representation. Then we construct a Gaussian repair model based on diffusion models to supplement the omitted object information, where Gaussians are further refined. We design a self-generating strategy to obtain image pairs for training the repair model. Our GaussianObject is evaluated on several challenging datasets, including MipNeRF360, OmniObject3D, and OpenIllumination, achieving strong reconstruction results from only 4 views and significantly outperforming previous state-of-the-art methods.

Summary

AI-Generated Summary

PDF164December 15, 2024