F4Splat: 피드-포워드 3D 가우시안 스플래팅을 위한 피드-포워드 예측 밀도화
F4Splat: Feed-Forward Predictive Densification for Feed-Forward 3D Gaussian Splatting
March 22, 2026
저자: Injae Kim, Chaehyeon Kim, Minseong Bae, Minseok Joo, Hyunwoo J. Kim
cs.AI
초록
피드포워드 3D 가우시안 스플랫팅 방법은 단일 패스(single-pass) 재구성과 실시간 렌더링을 가능하게 합니다. 그러나 이 방법들은 일반적으로 픽셀-가우시안 또는 복셀-가우시안과 같은 경직된 파이프라인을 채택하여 균일하게 가우시안을 할당함으로써 다양한 시점에서 중복된 가우시안이 발생하는 문제가 있습니다. 더욱이, 재구성 정확도를 유지하면서 총 가우시안 수를 효과적으로 제어할 수 있는 메커니즘이 부족합니다. 이러한 한계를 해결하기 위해 본 논문에서는 F4Splat을 제안합니다. F4Splat은 피드포워드 3D 가우시안 스플랫팅을 위한 피드포워드 예측적 밀도화(densification)를 수행하며, 공간적 복잡도와 다중 시점 중첩도에 따라 가우시안을 적응적으로 분배하는 밀도화-점수-기반 할당 전략을 도입합니다. 우리 모델은 지역별 밀도화 점수를 예측하여 필요한 가우시안 밀도를 추정하고, 재학습 없이도 최종 가우시안 예산을 명시적으로 제어할 수 있도록 합니다. 이러한 공간 적응적 할당은 단순 영역에서의 중복성을 줄이고 중첩된 시점 간 중복 가우시안을 최소화하여 컴팩트하면서도 고품질의 3D 표현을 생성합니다. 광범위한 실험을 통해 우리 모델이 기존의 보정되지 않은(uncalibrated) 피드포워드 방법들에 비해 훨씬 적은 수의 가우시안을 사용하면서도 우수한 새로운 시점 합성 성능을 달성함을 입증합니다.
English
Feed-forward 3D Gaussian Splatting methods enable single-pass reconstruction and real-time rendering. However, they typically adopt rigid pixel-to-Gaussian or voxel-to-Gaussian pipelines that uniformly allocate Gaussians, leading to redundant Gaussians across views. Moreover, they lack an effective mechanism to control the total number of Gaussians while maintaining reconstruction fidelity. To address these limitations, we present F4Splat, which performs Feed-Forward predictive densification for Feed-Forward 3D Gaussian Splatting, introducing a densification-score-guided allocation strategy that adaptively distributes Gaussians according to spatial complexity and multi-view overlap. Our model predicts per-region densification scores to estimate the required Gaussian density and allows explicit control over the final Gaussian budget without retraining. This spatially adaptive allocation reduces redundancy in simple regions and minimizes duplicate Gaussians across overlapping views, producing compact yet high-quality 3D representations. Extensive experiments demonstrate that our model achieves superior novel-view synthesis performance compared to prior uncalibrated feed-forward methods, while using significantly fewer Gaussians.