BlockGaussian: 適応型ブロックベースのガウススプラッティングによる大規模シーンの効率的な新視点合成
BlockGaussian: Efficient Large-Scale Scene Novel View Synthesis via Adaptive Block-Based Gaussian Splatting
April 12, 2025
著者: Yongchang Wu, Zipeng Qi, Zhenwei Shi, Zhengxia Zou
cs.AI
要旨
3Dガウススプラッティング(3DGS)の最近の進展は、新規視点合成タスクにおいて顕著な可能性を示しています。分割統治パラダイムにより大規模シーン再構成が可能となりましたが、シーンの分割、最適化、および統合プロセスにおいて依然として重要な課題が残されています。本論文では、BlockGaussianという新しいフレームワークを紹介します。このフレームワークは、コンテンツを考慮したシーン分割戦略と可視性を考慮したブロック最適化を組み込むことで、効率的かつ高品質な大規模シーン再構成を実現します。具体的には、異なる領域間のコンテンツ複雑度の変動を考慮し、シーン分割時の計算負荷をバランスさせることで、効率的なシーン再構成を可能にします。独立したブロック最適化時の監督ミスマッチ問題に対処するため、個々のブロック最適化中に補助点を導入し、グラウンドトゥルースの監督を整合させ、再構成品質を向上させます。さらに、ブロック統合時に発生する空中浮遊物によるレンダリングの劣化を効果的に軽減する疑似視点幾何制約を提案します。大規模シーンにおける広範な実験により、本手法が再構成効率とレンダリング品質の両方において最先端の性能を達成し、最適化速度が5倍向上し、複数のベンチマークで平均PSNRが1.21 dB向上することが示されました。特に、BlockGaussianは計算要件を大幅に削減し、単一の24GB VRAMデバイスでの大規模シーン再構成を可能にします。プロジェクトページはhttps://github.com/SunshineWYC/BlockGaussianで公開されています。
English
The recent advancements in 3D Gaussian Splatting (3DGS) have demonstrated
remarkable potential in novel view synthesis tasks. The divide-and-conquer
paradigm has enabled large-scale scene reconstruction, but significant
challenges remain in scene partitioning, optimization, and merging processes.
This paper introduces BlockGaussian, a novel framework incorporating a
content-aware scene partition strategy and visibility-aware block optimization
to achieve efficient and high-quality large-scale scene reconstruction.
Specifically, our approach considers the content-complexity variation across
different regions and balances computational load during scene partitioning,
enabling efficient scene reconstruction. To tackle the supervision mismatch
issue during independent block optimization, we introduce auxiliary points
during individual block optimization to align the ground-truth supervision,
which enhances the reconstruction quality. Furthermore, we propose a
pseudo-view geometry constraint that effectively mitigates rendering
degradation caused by airspace floaters during block merging. Extensive
experiments on large-scale scenes demonstrate that our approach achieves
state-of-the-art performance in both reconstruction efficiency and rendering
quality, with a 5x speedup in optimization and an average PSNR improvement of
1.21 dB on multiple benchmarks. Notably, BlockGaussian significantly reduces
computational requirements, enabling large-scale scene reconstruction on a
single 24GB VRAM device. The project page is available at
https://github.com/SunshineWYC/BlockGaussianSummary
AI-Generated Summary