MVGS: Splatting Gaussiano regolato da multi-viste per la sintesi di nuove viste
MVGS: Multi-view-regulated Gaussian Splatting for Novel View Synthesis
October 2, 2024
Autori: Xiaobiao Du, Yida Wang, Xin Yu
cs.AI
Abstract
Lavori recenti nel rendering volumetrico, come NeRF e Splatting Gaussiano 3D (3DGS), avanzano significativamente la qualità e l'efficienza del rendering grazie all'uso del campo di radianza neurale implicito appreso o dei Gaussiani 3D. Applicando il rendering su una rappresentazione esplicita, il 3DGS "vanilla" e le sue varianti offrono efficienza in tempo reale ottimizzando il modello parametrico con supervisione single-view per iterazione durante l'addestramento, adottato da NeRF. Di conseguenza, alcune viste sono sovradattate, portando a un'aspetto insoddisfacente nella sintesi di nuove viste e a geometrie 3D imprecise. Per risolvere i problemi sopra citati, proponiamo un nuovo metodo di ottimizzazione 3DGS che incorpora quattro importanti contributi innovativi: 1) Trasformiamo il convenzionale paradigma di addestramento single-view in una strategia di addestramento multi-view. Con la nostra proposta di regolazione multi-view, gli attributi Gaussiani 3D vengono ulteriormente ottimizzati senza sovra-adattare alcune viste di addestramento. Come soluzione generale, miglioriamo la precisione complessiva in una varietà di scenari e diverse varianti Gaussiane. 2) Ispirati dal beneficio introdotto dalle viste aggiuntive, proponiamo inoltre uno schema di guida cross-intrinseca, portando a una procedura di addestramento da grossolano a fine riguardante diverse risoluzioni. 3) Basandoci sul nostro addestramento regolato multi-view, proponiamo ulteriormente una strategia di densificazione dei raggi incrociati, densificando più kernel Gaussiani nelle regioni di intersezione dei raggi da una selezione di viste. 4) Approfondendo ulteriormente la strategia di densificazione, abbiamo scoperto che l'effetto della densificazione dovrebbe essere potenziato quando alcune viste sono distintamente diverse. Come soluzione, proponiamo una nuova strategia di densificazione aumentata multi-view, dove i Gaussiani 3D sono incoraggiati a essere densificati in un numero sufficiente di conseguenza, portando a un'accuratezza di ricostruzione migliorata.
English
Recent works in volume rendering, e.g. NeRF and 3D Gaussian
Splatting (3DGS), significantly advance the rendering quality and efficiency
with the help of the learned implicit neural radiance field or 3D Gaussians.
Rendering on top of an explicit representation, the vanilla 3DGS and its
variants deliver real-time efficiency by optimizing the parametric model with
single-view supervision per iteration during training which is adopted from
NeRF. Consequently, certain views are overfitted, leading to unsatisfying
appearance in novel-view synthesis and imprecise 3D geometries. To solve
aforementioned problems, we propose a new 3DGS optimization method embodying
four key novel contributions: 1) We transform the conventional single-view
training paradigm into a multi-view training strategy. With our proposed
multi-view regulation, 3D Gaussian attributes are further optimized without
overfitting certain training views. As a general solution, we improve the
overall accuracy in a variety of scenarios and different Gaussian variants. 2)
Inspired by the benefit introduced by additional views, we further propose a
cross-intrinsic guidance scheme, leading to a coarse-to-fine training procedure
concerning different resolutions. 3) Built on top of our multi-view regulated
training, we further propose a cross-ray densification strategy, densifying
more Gaussian kernels in the ray-intersect regions from a selection of views.
4) By further investigating the densification strategy, we found that the
effect of densification should be enhanced when certain views are distinct
dramatically. As a solution, we propose a novel multi-view augmented
densification strategy, where 3D Gaussians are encouraged to get densified to a
sufficient number accordingly, resulting in improved reconstruction accuracy.