적은 가우시안, 풍부한 텍스처: 4K 피드포워드 텍스처 스플래팅
Less Gaussians, Texture More: 4K Feed-Forward Textured Splatting
March 26, 2026
저자: Yixing Lao, Xuyang Bai, Xiaoyang Wu, Nuoyuan Yan, Zixin Luo, Tian Fang, Jean-Daniel Nahmias, Yanghai Tsin, Shiwei Li, Hengshuang Zhao
cs.AI
초록
기존 피드포워드 3D 가우시안 스플래팅 방법은 픽셀 정렬 프리미티브를 예측하여 해상도 증가에 따라 프리미티브 수가 2차적으로 증가하는 문제가 있습니다. 이는 확장성에 근본적인 한계를 부여하여 4K와 같은 고해상도 합성을 실질적으로 불가능하게 만듭니다. 본 연구에서는 이 해상도 확장 장벽을 극복하는 피드포워드 프레임워크인 LGTM(적은 가우시안, 더 많은 텍스처)을 소개합니다. LGTM은 컴팩트한 가우시안 프리미티브와 프리미티브별 텍스처를 함께 예측하여 기하학적 복잡성과 렌더링 해상도의 결합을 해제합니다. 이 접근법은 장면별 최적화 없이도 이전까지 피드포워드 방법으로는 달성할 수 없었던 고품질 4K 신시점 합성을 가능하게 하며, 동시에 훨씬 더 적은 수의 가우시안 프리미티브를 사용합니다. 프로젝트 페이지: https://yxlao.github.io/lgtm/
English
Existing feed-forward 3D Gaussian Splatting methods predict pixel-aligned primitives, leading to a quadratic growth in primitive count as resolution increases. This fundamentally limits their scalability, making high-resolution synthesis such as 4K intractable. We introduce LGTM (Less Gaussians, Texture More), a feed-forward framework that overcomes this resolution scaling barrier. By predicting compact Gaussian primitives coupled with per-primitive textures, LGTM decouples geometric complexity from rendering resolution. This approach enables high-fidelity 4K novel view synthesis without per-scene optimization, a capability previously out of reach for feed-forward methods, all while using significantly fewer Gaussian primitives. Project page: https://yxlao.github.io/lgtm/