GaussianObject: Получение высококачественного 3D-объекта всего по четырем изображениям с использованием Gaussian Splatting
GaussianObject: Just Taking Four Images to Get A High-Quality 3D Object with Gaussian Splatting
February 15, 2024
Авторы: Chen Yang, Sikuang Li, Jiemin Fang, Ruofan Liang, Lingxi Xie, Xiaopeng Zhang, Wei Shen, Qi Tian
cs.AI
Аннотация
Реконструкция и визуализация 3D-объектов на основе крайне ограниченного числа ракурсов имеет критически важное значение для продвижения приложений 3D-визуализации и улучшения пользовательского опыта. Однако изображения, полученные с ограниченного числа ракурсов, содержат лишь минимальную 3D-информацию, что приводит к двум основным проблемам: 1) сложность в установлении многовидовой согласованности из-за недостаточного количества изображений для сопоставления; 2) частичное отсутствие или сильное сжатие информации об объекте из-за недостаточного охвата ракурсов. Для решения этих проблем мы предлагаем GaussianObject — фреймворк для представления и визуализации 3D-объектов с использованием гауссовых сплатов, который обеспечивает высокое качество рендеринга всего на основе 4 входных изображений. Сначала мы внедряем методы визуального каркаса и устранения "плавающих" артефактов, которые явно вводят структурные априорные знания в начальный процесс оптимизации, что помогает установить многовидовую согласованность и создает грубое представление объекта в виде гауссовых распределений. Затем мы строим модель восстановления гауссовых распределений на основе диффузионных моделей, чтобы восполнить недостающую информацию об объекте, где гауссовы распределения дополнительно уточняются. Мы разрабатываем стратегию самогенерации для получения пар изображений, используемых для обучения модели восстановления. Наш GaussianObject оценивается на нескольких сложных наборах данных, включая MipNeRF360, OmniObject3D и OpenIllumination, демонстрируя впечатляющие результаты реконструкции всего на основе 4 ракурсов и значительно превосходя предыдущие передовые методы.
English
Reconstructing and rendering 3D objects from highly sparse views is of
critical importance for promoting applications of 3D vision techniques and
improving user experience. However, images from sparse views only contain very
limited 3D information, leading to two significant challenges: 1) Difficulty in
building multi-view consistency as images for matching are too few; 2)
Partially omitted or highly compressed object information as view coverage is
insufficient. To tackle these challenges, we propose GaussianObject, a
framework to represent and render the 3D object with Gaussian splatting, that
achieves high rendering quality with only 4 input images. We first introduce
techniques of visual hull and floater elimination which explicitly inject
structure priors into the initial optimization process for helping build
multi-view consistency, yielding a coarse 3D Gaussian representation. Then we
construct a Gaussian repair model based on diffusion models to supplement the
omitted object information, where Gaussians are further refined. We design a
self-generating strategy to obtain image pairs for training the repair model.
Our GaussianObject is evaluated on several challenging datasets, including
MipNeRF360, OmniObject3D, and OpenIllumination, achieving strong reconstruction
results from only 4 views and significantly outperforming previous
state-of-the-art methods.Summary
AI-Generated Summary