4K4D: 4K 해상도에서 실시간 4D 뷰 합성
4K4D: Real-Time 4D View Synthesis at 4K Resolution
October 17, 2023
저자: Zhen Xu, Sida Peng, Haotong Lin, Guangzhao He, Jiaming Sun, Yujun Shen, Hujun Bao, Xiaowei Zhou
cs.AI
초록
본 논문은 4K 해상도의 동적 3D 장면에 대한 고품질 실시간 뷰 합성을 목표로 한다. 최근 동적 뷰 합성을 위한 일부 방법들이 인상적인 렌더링 품질을 보여주고 있지만, 고해상도 이미지를 렌더링할 때의 속도는 여전히 제한적이다. 이 문제를 해결하기 위해, 본 논문에서는 하드웨어 래스터화를 지원하고 전례 없는 렌더링 속도를 가능하게 하는 4D 포인트 클라우드 표현인 4K4D를 제안한다. 우리의 표현은 4D 특징 그리드 위에 구축되어 포인트들이 자연스럽게 정규화되고 견고하게 최적화될 수 있도록 한다. 또한, 효율성을 유지하면서 렌더링 품질을 크게 향상시키는 새로운 하이브리드 외관 모델을 설계하였다. 더 나아가, RGB 비디오로부터 제안된 모델을 효과적으로 학습하기 위해 미분 가능한 깊이 필링 알고리즘을 개발하였다. 실험 결과, 우리의 표현은 RTX 4090 GPU를 사용하여 DNA-Rendering 데이터셋에서 1080p 해상도로 400 FPS 이상, ENeRF-Outdoor 데이터셋에서 4K 해상도로 80 FPS로 렌더링될 수 있으며, 이는 기존 방법보다 30배 빠른 속도로 최신의 렌더링 품질을 달성한다. 재현성을 위해 코드를 공개할 예정이다.
English
This paper targets high-fidelity and real-time view synthesis of dynamic 3D
scenes at 4K resolution. Recently, some methods on dynamic view synthesis have
shown impressive rendering quality. However, their speed is still limited when
rendering high-resolution images. To overcome this problem, we propose 4K4D, a
4D point cloud representation that supports hardware rasterization and enables
unprecedented rendering speed. Our representation is built on a 4D feature grid
so that the points are naturally regularized and can be robustly optimized. In
addition, we design a novel hybrid appearance model that significantly boosts
the rendering quality while preserving efficiency. Moreover, we develop a
differentiable depth peeling algorithm to effectively learn the proposed model
from RGB videos. Experiments show that our representation can be rendered at
over 400 FPS on the DNA-Rendering dataset at 1080p resolution and 80 FPS on the
ENeRF-Outdoor dataset at 4K resolution using an RTX 4090 GPU, which is 30x
faster than previous methods and achieves the state-of-the-art rendering
quality. We will release the code for reproducibility.