BlockGaussian: Effiziente großskalige Szenerie-Neuansichtssynthese durch adaptive blockbasierte Gaußsche Splatting
BlockGaussian: Efficient Large-Scale Scene Novel View Synthesis via Adaptive Block-Based Gaussian Splatting
April 12, 2025
Autoren: Yongchang Wu, Zipeng Qi, Zhenwei Shi, Zhengxia Zou
cs.AI
Zusammenfassung
Die jüngsten Fortschritte im Bereich des 3D Gaussian Splatting (3DGS) haben bemerkenswertes Potenzial bei der Synthese neuer Ansichten gezeigt. Das Divide-and-Conquer-Paradigma ermöglichte die Rekonstruktion großflächiger Szenen, doch bestehen weiterhin erhebliche Herausforderungen bei der Szenenpartitionierung, Optimierung und dem Zusammenführungsprozess. Dieses Papier stellt BlockGaussian vor, ein neuartiges Framework, das eine inhaltsbewusste Szenenpartitionierungsstrategie und eine sichtbarkeitsbasierte Blockoptimierung integriert, um eine effiziente und hochwertige Rekonstruktion großflächiger Szenen zu erreichen. Konkret berücksichtigt unser Ansatz die variationsreiche Inhaltskomplexität in verschiedenen Regionen und gleicht die Rechenlast während der Szenenpartitionierung aus, was eine effiziente Szenenrekonstruktion ermöglicht. Um das Problem der fehlenden Übereinstimmung bei der unabhängigen Blockoptimierung zu lösen, führen wir Hilfspunkte während der individuellen Blockoptimierung ein, um die Ground-Truth-Überwachung auszurichten, was die Rekonstruktionsqualität verbessert. Darüber hinaus schlagen wir eine pseudo-ansichtsbasierte Geometriebeschränkung vor, die die durch Luftraum-Floater verursachte Rendering-Verschlechterung während der Blockzusammenführung effektiv reduziert. Umfangreiche Experimente an großflächigen Szenen zeigen, dass unser Ansatz sowohl in der Rekonstruktionseffizienz als auch in der Rendering-Qualität Spitzenleistungen erzielt, mit einer 5-fachen Beschleunigung der Optimierung und einer durchschnittlichen PSNR-Verbesserung von 1,21 dB bei mehreren Benchmarks. Insbesondere reduziert BlockGaussian den Rechenbedarf erheblich und ermöglicht die Rekonstruktion großflächiger Szenen auf einem einzelnen 24GB-VRAM-Gerät. Die Projektseite ist unter https://github.com/SunshineWYC/BlockGaussian verfügbar.
English
The recent advancements in 3D Gaussian Splatting (3DGS) have demonstrated
remarkable potential in novel view synthesis tasks. The divide-and-conquer
paradigm has enabled large-scale scene reconstruction, but significant
challenges remain in scene partitioning, optimization, and merging processes.
This paper introduces BlockGaussian, a novel framework incorporating a
content-aware scene partition strategy and visibility-aware block optimization
to achieve efficient and high-quality large-scale scene reconstruction.
Specifically, our approach considers the content-complexity variation across
different regions and balances computational load during scene partitioning,
enabling efficient scene reconstruction. To tackle the supervision mismatch
issue during independent block optimization, we introduce auxiliary points
during individual block optimization to align the ground-truth supervision,
which enhances the reconstruction quality. Furthermore, we propose a
pseudo-view geometry constraint that effectively mitigates rendering
degradation caused by airspace floaters during block merging. Extensive
experiments on large-scale scenes demonstrate that our approach achieves
state-of-the-art performance in both reconstruction efficiency and rendering
quality, with a 5x speedup in optimization and an average PSNR improvement of
1.21 dB on multiple benchmarks. Notably, BlockGaussian significantly reduces
computational requirements, enabling large-scale scene reconstruction on a
single 24GB VRAM device. The project page is available at
https://github.com/SunshineWYC/BlockGaussianSummary
AI-Generated Summary