ICON: Incremento della CONfidenza per l'Ottimizzazione Congiunta della Posa e del Campo di Radianza

Abstract

I Neural Radiance Fields (NeRF) dimostrano prestazioni eccezionali nella Sintesi di Nuove Visualizzazioni (NVS) a partire da un insieme di immagini 2D. Tuttavia, l'addestramento di NeRF richiede pose della fotocamera accurate per ciascuna vista di input, tipicamente ottenute tramite pipeline di Structure-from-Motion (SfM). Recenti lavori hanno cercato di rilassare questo vincolo, ma spesso continuano a dipendere da pose iniziali decenti che possono essere affinate. In questo lavoro, miriamo a eliminare la necessità di un'inizializzazione delle pose. Presentiamo Incremental CONfidence (ICON), una procedura di ottimizzazione per l'addestramento di NeRF a partire da fotogrammi di video 2D. ICON assume solo un movimento fluido della fotocamera per stimare un'ipotesi iniziale delle pose. Inoltre, ICON introduce il concetto di "confidenza": una misura adattativa della qualità del modello utilizzata per ponderare dinamicamente i gradienti. ICON si affida a pose ad alta confidenza per apprendere il NeRF e a una struttura 3D ad alta confidenza (codificata dal NeRF) per apprendere le pose. Dimostriamo che ICON, senza un'inizializzazione preliminare delle pose, raggiunge prestazioni superiori sia in CO3D che in HO3D rispetto ai metodi che utilizzano pose ottenute tramite SfM.

English

Neural Radiance Fields (NeRF) exhibit remarkable performance for Novel View Synthesis (NVS) given a set of 2D images. However, NeRF training requires accurate camera pose for each input view, typically obtained by Structure-from-Motion (SfM) pipelines. Recent works have attempted to relax this constraint, but they still often rely on decent initial poses which they can refine. Here we aim at removing the requirement for pose initialization. We present Incremental CONfidence (ICON), an optimization procedure for training NeRFs from 2D video frames. ICON only assumes smooth camera motion to estimate initial guess for poses. Further, ICON introduces ``confidence": an adaptive measure of model quality used to dynamically reweight gradients. ICON relies on high-confidence poses to learn NeRF, and high-confidence 3D structure (as encoded by NeRF) to learn poses. We show that ICON, without prior pose initialization, achieves superior performance in both CO3D and HO3D versus methods which use SfM pose.

ICON: Incremento della CONfidenza per l'Ottimizzazione Congiunta della Posa e del Campo di Radianza

ICON: Incremental CONfidence for Joint Pose and Radiance Field Optimization

Abstract

Support