ChatPaper.aiChatPaper

4DGS360: Ricostruzione Gaussiana a 360° di Oggetti Dinamici da un Singolo Video

4DGS360: 360° Gaussian Reconstruction of Dynamic Objects from a Single Video

March 23, 2026
Autori: Jae Won Jang, Yeonjin Chang, Wonsik Shin, Juhwan Cho, Nojun Kwak
cs.AI

Abstract

Presentiamo 4DGS360, un framework senza diffusione per la ricostruzione dinamica a 360° di oggetti a partire da video monoculari casuali. I metodi esistenti spesso non riescono a ricostruire una geometria coerente a 360°, poiché la loro forte dipendenza da prior native del 2D fa sì che i punti iniziali si adattino eccessivamente alla superficie visibile in ciascuna vista di addestramento. 4DGS360 affronta questa sfida attraverso un'inizializzazione avanzata nativa del 3D che mitiga l'ambiguità geometrica delle regioni occluse. Il nostro tracker 3D proposto, AnchorTAP3D, produce traiettorie di punti 3D rinforzate sfruttando punti di tracciamento 2D affidabili come ancore, sopprimendo la deriva e fornendo un'inizializzazione affidabile che preserva la geometria nelle regioni occluse. Questa inizializzazione, combinata con l'ottimizzazione, produce ricostruzioni 4D coerenti a 360°. Presentiamo inoltre iPhone360, un nuovo benchmark in cui le telecamere di test sono posizionate fino a 135° di distanza dalle viste di addestramento, consentendo una valutazione a 360° che i dataset esistenti non possono fornire. Gli esperimenti mostrano che 4DGS360 raggiunge prestazioni allo stato dell'arte sui dataset iPhone360, iPhone e DAVIS, sia qualitativamente che quantitativamente.
English
We introduce 4DGS360, a diffusion-free framework for 360^{circ} dynamic object reconstruction from casual monocular video. Existing methods often fail to reconstruct consistent 360^{circ} geometry, as their heavy reliance on 2D-native priors causes initial points to overfit to visible surface in each training view. 4DGS360 addresses this challenge through a advanced 3D-native initialization that mitigates the geometric ambiguity of occluded regions. Our proposed 3D tracker, AnchorTAP3D, produces reinforced 3D point trajectories by leveraging confident 2D track points as anchors, suppressing drift and providing reliable initialization that preserves geometry in occluded regions. This initialization, combined with optimization, yields coherent 360^{circ} 4D reconstructions. We further present iPhone360, a new benchmark where test cameras are placed up to 135^{circ} apart from training views, enabling 360^{circ} evaluation that existing datasets cannot provide. Experiments show that 4DGS360 achieves state-of-the-art performance on the iPhone360, iPhone, and DAVIS datasets, both qualitatively and quantitatively.
PDF91March 27, 2026