ChatPaper.aiChatPaper

4K4D:4K解像度でのリアルタイム4Dビュー合成

4K4D: Real-Time 4D View Synthesis at 4K Resolution

October 17, 2023
著者: Zhen Xu, Sida Peng, Haotong Lin, Guangzhao He, Jiaming Sun, Yujun Shen, Hujun Bao, Xiaowei Zhou
cs.AI

要旨

本論文は、4K解像度における動的3Dシーンの高忠実度かつリアルタイムなビュー合成を対象としている。最近、動的ビュー合成に関するいくつかの手法が印象的なレンダリング品質を示している。しかし、高解像度画像をレンダリングする際の速度は依然として制限されている。この問題を克服するため、我々はハードウェアラスタライゼーションをサポートし、前例のないレンダリング速度を実現する4D点群表現である4K4Dを提案する。我々の表現は4D特徴グリッドに基づいて構築されており、点群が自然に正則化され、堅牢に最適化される。さらに、効率を維持しながらレンダリング品質を大幅に向上させる新しいハイブリッド外観モデルを設計した。また、RGBビデオから提案モデルを効果的に学習するための微分可能な深度ピーリングアルゴリズムを開発した。実験結果によると、我々の表現はRTX 4090 GPUを使用して、DNA-Renderingデータセットでは1080p解像度で400 FPS以上、ENeRF-Outdoorデータセットでは4K解像度で80 FPSでレンダリング可能であり、従来の手法よりも30倍高速で、最先端のレンダリング品質を達成している。再現性のためにコードを公開する予定である。
English
This paper targets high-fidelity and real-time view synthesis of dynamic 3D scenes at 4K resolution. Recently, some methods on dynamic view synthesis have shown impressive rendering quality. However, their speed is still limited when rendering high-resolution images. To overcome this problem, we propose 4K4D, a 4D point cloud representation that supports hardware rasterization and enables unprecedented rendering speed. Our representation is built on a 4D feature grid so that the points are naturally regularized and can be robustly optimized. In addition, we design a novel hybrid appearance model that significantly boosts the rendering quality while preserving efficiency. Moreover, we develop a differentiable depth peeling algorithm to effectively learn the proposed model from RGB videos. Experiments show that our representation can be rendered at over 400 FPS on the DNA-Rendering dataset at 1080p resolution and 80 FPS on the ENeRF-Outdoor dataset at 4K resolution using an RTX 4090 GPU, which is 30x faster than previous methods and achieves the state-of-the-art rendering quality. We will release the code for reproducibility.
PDF404December 15, 2024