MVGS: Многозрительное регулируемое гауссово наложение для синтеза нового вида.
MVGS: Multi-view-regulated Gaussian Splatting for Novel View Synthesis
October 2, 2024
Авторы: Xiaobiao Du, Yida Wang, Xin Yu
cs.AI
Аннотация
Недавние работы в объемной визуализации, например, NeRF и 3D Gaussian Splatting (3DGS), значительно улучшают качество и эффективность визуализации с помощью изученного неявного нейронного радиационного поля или 3D гауссов. Визуализация поверх явного представления, обычный 3DGS и его варианты обеспечивают эффективность реального времени путем оптимизации параметрической модели с однообзорным наблюдением на каждой итерации обучения, что заимствовано у NeRF. Следовательно, определенные виды переобучаются, что приводит к неудовлетворительному внешнему виду при синтезе нового вида и неточным 3D геометриям. Для решения вышеупомянутых проблем мы предлагаем новый метод оптимизации 3DGS, воплощающий четыре ключевых новаторских вклада: 1) Мы преобразуем традиционную парадигму обучения с одним видом в стратегию обучения с несколькими видами. С нашим предложенным мультивидовым регулированием атрибуты 3D гауссов дополнительно оптимизируются без переобучения определенных обучающих видов. Как общее решение, мы улучшаем общую точность в различных сценариях и различных вариантах гауссов. 2) Вдохновленные преимуществом, внесенным дополнительными видами, мы далее предлагаем схему перекрестного внутреннего руководства, приводящую к грубому и тонкому процессу обучения по разным разрешениям. 3) На основе нашего мультивидового регулируемого обучения мы далее предлагаем стратегию перекрестного плотного луча, уплотняя больше гауссовских ядер в областях пересечения лучей из выбранных видов. 4) Исследуя стратегию уплотнения, мы обнаружили, что эффект уплотнения должен быть усилен, когда определенные виды сильно отличаются. В качестве решения мы предлагаем новую стратегию уплотнения с увеличенным мультивидовым усилением, где 3D гауссы стимулируются к уплотнению до достаточного количества соответственно, что приводит к улучшенной точности восстановления.
English
Recent works in volume rendering, e.g. NeRF and 3D Gaussian
Splatting (3DGS), significantly advance the rendering quality and efficiency
with the help of the learned implicit neural radiance field or 3D Gaussians.
Rendering on top of an explicit representation, the vanilla 3DGS and its
variants deliver real-time efficiency by optimizing the parametric model with
single-view supervision per iteration during training which is adopted from
NeRF. Consequently, certain views are overfitted, leading to unsatisfying
appearance in novel-view synthesis and imprecise 3D geometries. To solve
aforementioned problems, we propose a new 3DGS optimization method embodying
four key novel contributions: 1) We transform the conventional single-view
training paradigm into a multi-view training strategy. With our proposed
multi-view regulation, 3D Gaussian attributes are further optimized without
overfitting certain training views. As a general solution, we improve the
overall accuracy in a variety of scenarios and different Gaussian variants. 2)
Inspired by the benefit introduced by additional views, we further propose a
cross-intrinsic guidance scheme, leading to a coarse-to-fine training procedure
concerning different resolutions. 3) Built on top of our multi-view regulated
training, we further propose a cross-ray densification strategy, densifying
more Gaussian kernels in the ray-intersect regions from a selection of views.
4) By further investigating the densification strategy, we found that the
effect of densification should be enhanced when certain views are distinct
dramatically. As a solution, we propose a novel multi-view augmented
densification strategy, where 3D Gaussians are encouraged to get densified to a
sufficient number accordingly, resulting in improved reconstruction accuracy.Summary
AI-Generated Summary