ChatPaper.aiChatPaper

LongSplat: Splatting 3D Gaussiano Robusto per Video Lunghi Casuali senza Posa

LongSplat: Robust Unposed 3D Gaussian Splatting for Casual Long Videos

August 19, 2025
Autori: Chin-Yang Lin, Cheng Sun, Fu-En Yang, Min-Hung Chen, Yen-Yu Lin, Yu-Lun Liu
cs.AI

Abstract

LongSplat affronta le sfide critiche nella sintesi di nuove visualizzazioni (NVS) a partire da video lunghi acquisiti casualmente, caratterizzati da movimenti irregolari della telecamera, pose della telecamera sconosciute e scene ampie. I metodi attuali spesso soffrono di deriva delle pose, inizializzazione geometrica imprecisa e gravi limitazioni di memoria. Per risolvere questi problemi, introduciamo LongSplat, un robusto framework di 3D Gaussian Splatting senza pose che include: (1) Ottimizzazione Incrementale Congiunta che ottimizza simultaneamente le pose della telecamera e i Gaussian 3D per evitare minimi locali e garantire coerenza globale; (2) un Modulo di Stima delle Pose Robusto che sfrutta prior 3D appresi; e (3) un meccanismo efficiente di Formazione di Ancore Octree che converte nuvole di punti dense in ancore basate sulla densità spaziale. Esperimenti estesi su benchmark impegnativi dimostrano che LongSplat raggiunge risultati all'avanguardia, migliorando sostanzialmente la qualità del rendering, l'accuratezza delle pose e l'efficienza computazionale rispetto agli approcci precedenti. Pagina del progetto: https://linjohnss.github.io/longsplat/
English
LongSplat addresses critical challenges in novel view synthesis (NVS) from casually captured long videos characterized by irregular camera motion, unknown camera poses, and expansive scenes. Current methods often suffer from pose drift, inaccurate geometry initialization, and severe memory limitations. To address these issues, we introduce LongSplat, a robust unposed 3D Gaussian Splatting framework featuring: (1) Incremental Joint Optimization that concurrently optimizes camera poses and 3D Gaussians to avoid local minima and ensure global consistency; (2) a robust Pose Estimation Module leveraging learned 3D priors; and (3) an efficient Octree Anchor Formation mechanism that converts dense point clouds into anchors based on spatial density. Extensive experiments on challenging benchmarks demonstrate that LongSplat achieves state-of-the-art results, substantially improving rendering quality, pose accuracy, and computational efficiency compared to prior approaches. Project page: https://linjohnss.github.io/longsplat/
PDF592August 20, 2025