GaussianObject: Obtén un objeto 3D de alta calidad con solo cuatro imágenes usando Gaussian Splatting
GaussianObject: Just Taking Four Images to Get A High-Quality 3D Object with Gaussian Splatting
February 15, 2024
Autores: Chen Yang, Sikuang Li, Jiemin Fang, Ruofan Liang, Lingxi Xie, Xiaopeng Zhang, Wei Shen, Qi Tian
cs.AI
Resumen
Reconstruir y renderizar objetos 3D a partir de vistas altamente dispersas es de
importancia crítica para promover las aplicaciones de las técnicas de visión 3D y
mejorar la experiencia del usuario. Sin embargo, las imágenes de vistas dispersas solo contienen
información 3D muy limitada, lo que conlleva dos desafíos significativos: 1) Dificultad para
establecer consistencia multivista, ya que las imágenes disponibles para emparejar son muy pocas; 2)
Información del objeto parcialmente omitida o altamente comprimida debido a una cobertura de vistas insuficiente. Para abordar estos desafíos, proponemos GaussianObject, un
marco para representar y renderizar el objeto 3D mediante splatting Gaussiano, que
logra una alta calidad de renderizado con solo 4 imágenes de entrada. Primero introducimos
técnicas de visual hull y eliminación de flotadores, que inyectan explícitamente
prioridades estructurales en el proceso de optimización inicial para ayudar a establecer
consistencia multivista, obteniendo una representación Gaussiana 3D aproximada. Luego construimos
un modelo de reparación Gaussiano basado en modelos de difusión para complementar la
información omitida del objeto, donde los Gaussianos se refinan aún más. Diseñamos una
estrategia de autogeneración para obtener pares de imágenes para entrenar el modelo de reparación.
Nuestro GaussianObject es evaluado en varios conjuntos de datos desafiantes, incluyendo
MipNeRF360, OmniObject3D y OpenIllumination, logrando fuertes resultados de reconstrucción
a partir de solo 4 vistas y superando significativamente a los métodos
estado del arte anteriores.
English
Reconstructing and rendering 3D objects from highly sparse views is of
critical importance for promoting applications of 3D vision techniques and
improving user experience. However, images from sparse views only contain very
limited 3D information, leading to two significant challenges: 1) Difficulty in
building multi-view consistency as images for matching are too few; 2)
Partially omitted or highly compressed object information as view coverage is
insufficient. To tackle these challenges, we propose GaussianObject, a
framework to represent and render the 3D object with Gaussian splatting, that
achieves high rendering quality with only 4 input images. We first introduce
techniques of visual hull and floater elimination which explicitly inject
structure priors into the initial optimization process for helping build
multi-view consistency, yielding a coarse 3D Gaussian representation. Then we
construct a Gaussian repair model based on diffusion models to supplement the
omitted object information, where Gaussians are further refined. We design a
self-generating strategy to obtain image pairs for training the repair model.
Our GaussianObject is evaluated on several challenging datasets, including
MipNeRF360, OmniObject3D, and OpenIllumination, achieving strong reconstruction
results from only 4 views and significantly outperforming previous
state-of-the-art methods.Summary
AI-Generated Summary