ChatPaper.aiChatPaper

4K4D: Echtzeit-4D-Ansichtsynthese in 4K-Auflösung

4K4D: Real-Time 4D View Synthesis at 4K Resolution

October 17, 2023
Autoren: Zhen Xu, Sida Peng, Haotong Lin, Guangzhao He, Jiaming Sun, Yujun Shen, Hujun Bao, Xiaowei Zhou
cs.AI

Zusammenfassung

Dieses Paper zielt auf die hochauflösende und echtzeitfähige Ansichtssynthese dynamischer 3D-Szenen in 4K-Auflösung ab. Kürzlich haben einige Methoden zur dynamischen Ansichtssynthese beeindruckende Rendering-Qualitäten gezeigt. Ihre Geschwindigkeit ist jedoch nach wie vor begrenzt, wenn hochauflösende Bilder gerendert werden. Um dieses Problem zu überwinden, schlagen wir 4K4D vor, eine 4D-Punktwolken-Darstellung, die Hardware-Rasterisierung unterstützt und eine beispiellose Rendering-Geschwindigkeit ermöglicht. Unsere Darstellung basiert auf einem 4D-Feature-Grid, sodass die Punkte natürlich regularisiert und robust optimiert werden können. Zudem entwerfen wir ein neuartiges hybrides Erscheinungsmodell, das die Rendering-Qualität erheblich steigert, während die Effizienz erhalten bleibt. Darüber hinaus entwickeln wir einen differenzierbaren Depth-Peeling-Algorithmus, um das vorgeschlagene Modell effektiv aus RGB-Videos zu lernen. Experimente zeigen, dass unsere Darstellung mit über 400 FPS auf dem DNA-Rendering-Datensatz bei 1080p-Auflösung und 80 FPS auf dem ENeRF-Outdoor-Datensatz bei 4K-Auflösung mit einer RTX 4090 GPU gerendert werden kann, was 30-mal schneller ist als bisherige Methoden und die state-of-the-art Rendering-Qualität erreicht. Wir werden den Code zur Reproduzierbarkeit veröffentlichen.
English
This paper targets high-fidelity and real-time view synthesis of dynamic 3D scenes at 4K resolution. Recently, some methods on dynamic view synthesis have shown impressive rendering quality. However, their speed is still limited when rendering high-resolution images. To overcome this problem, we propose 4K4D, a 4D point cloud representation that supports hardware rasterization and enables unprecedented rendering speed. Our representation is built on a 4D feature grid so that the points are naturally regularized and can be robustly optimized. In addition, we design a novel hybrid appearance model that significantly boosts the rendering quality while preserving efficiency. Moreover, we develop a differentiable depth peeling algorithm to effectively learn the proposed model from RGB videos. Experiments show that our representation can be rendered at over 400 FPS on the DNA-Rendering dataset at 1080p resolution and 80 FPS on the ENeRF-Outdoor dataset at 4K resolution using an RTX 4090 GPU, which is 30x faster than previous methods and achieves the state-of-the-art rendering quality. We will release the code for reproducibility.
PDF404December 15, 2024