LongSplat: カジュアルな長時間動画のためのロバストな非ポーズ3Dガウススプラッティング
LongSplat: Robust Unposed 3D Gaussian Splatting for Casual Long Videos
August 19, 2025
著者: Chin-Yang Lin, Cheng Sun, Fu-En Yang, Min-Hung Chen, Yen-Yu Lin, Yu-Lun Liu
cs.AI
要旨
LongSplatは、不規則なカメラモーション、未知のカメラポーズ、広大なシーンを特徴とするカジュアルに撮影された長時間動画からの新規視点合成(NVS)における重要な課題に対処します。既存の手法では、ポーズのドリフト、不正確なジオメトリ初期化、深刻なメモリ制限がしばしば問題となります。これらの課題を解決するため、我々はLongSplatを提案します。これは、以下の特徴を備えた堅牢な非ポーズ3Dガウススプラッティングフレームワークです:(1)局所最適化を回避し、グローバルな一貫性を確保するために、カメラポーズと3Dガウシアンを同時に最適化するインクリメンタルジョイント最適化、(2)学習された3D事前情報を活用した堅牢なポーズ推定モジュール、(3)空間密度に基づいて密な点群をアンカーに変換する効率的なオクツリーアンカー形成メカニズム。挑戦的なベンチマークでの広範な実験により、LongSplatが従来の手法に比べてレンダリング品質、ポーズ精度、計算効率を大幅に向上させ、最先端の結果を達成することが実証されました。プロジェクトページ: https://linjohnss.github.io/longsplat/
English
LongSplat addresses critical challenges in novel view synthesis (NVS) from
casually captured long videos characterized by irregular camera motion, unknown
camera poses, and expansive scenes. Current methods often suffer from pose
drift, inaccurate geometry initialization, and severe memory limitations. To
address these issues, we introduce LongSplat, a robust unposed 3D Gaussian
Splatting framework featuring: (1) Incremental Joint Optimization that
concurrently optimizes camera poses and 3D Gaussians to avoid local minima and
ensure global consistency; (2) a robust Pose Estimation Module leveraging
learned 3D priors; and (3) an efficient Octree Anchor Formation mechanism that
converts dense point clouds into anchors based on spatial density. Extensive
experiments on challenging benchmarks demonstrate that LongSplat achieves
state-of-the-art results, substantially improving rendering quality, pose
accuracy, and computational efficiency compared to prior approaches. Project
page: https://linjohnss.github.io/longsplat/