ChatPaper.aiChatPaper

4K4D: Real-time 4D-weergavesynthese bij 4K-resolutie

4K4D: Real-Time 4D View Synthesis at 4K Resolution

October 17, 2023
Auteurs: Zhen Xu, Sida Peng, Haotong Lin, Guangzhao He, Jiaming Sun, Yujun Shen, Hujun Bao, Xiaowei Zhou
cs.AI

Samenvatting

Dit artikel richt zich op hoogwaardige en realtime viewsynthese van dynamische 3D-scènes in 4K-resolutie. Recentelijk hebben enkele methoden voor dynamische viewsynthese indrukwekkende renderkwaliteit getoond. Hun snelheid blijft echter beperkt bij het renderen van hoogresolutiebeelden. Om dit probleem te overwinnen, stellen we 4K4D voor, een 4D-puntwolkrepresentatie die hardware-rasterisatie ondersteunt en een ongekende rendersnelheid mogelijk maakt. Onze representatie is gebouwd op een 4D-featuregrid, waardoor de punten van nature geregulariseerd zijn en robuust kunnen worden geoptimaliseerd. Daarnaast ontwerpen we een nieuw hybride uiterlijkheidsmodel dat de renderkwaliteit aanzienlijk verbetert terwijl de efficiëntie behouden blijft. Bovendien ontwikkelen we een differentieerbaar dieptepeelalgoritme om het voorgestelde model effectief te leren van RGB-video's. Experimenten tonen aan dat onze representatie kan worden gerenderd met meer dan 400 FPS op de DNA-Rendering dataset in 1080p-resolutie en 80 FPS op de ENeRF-Outdoor dataset in 4K-resolutie met een RTX 4090 GPU, wat 30x sneller is dan eerdere methoden en de state-of-the-art renderkwaliteit bereikt. We zullen de code vrijgeven voor reproduceerbaarheid.
English
This paper targets high-fidelity and real-time view synthesis of dynamic 3D scenes at 4K resolution. Recently, some methods on dynamic view synthesis have shown impressive rendering quality. However, their speed is still limited when rendering high-resolution images. To overcome this problem, we propose 4K4D, a 4D point cloud representation that supports hardware rasterization and enables unprecedented rendering speed. Our representation is built on a 4D feature grid so that the points are naturally regularized and can be robustly optimized. In addition, we design a novel hybrid appearance model that significantly boosts the rendering quality while preserving efficiency. Moreover, we develop a differentiable depth peeling algorithm to effectively learn the proposed model from RGB videos. Experiments show that our representation can be rendered at over 400 FPS on the DNA-Rendering dataset at 1080p resolution and 80 FPS on the ENeRF-Outdoor dataset at 4K resolution using an RTX 4090 GPU, which is 30x faster than previous methods and achieves the state-of-the-art rendering quality. We will release the code for reproducibility.
PDF404December 15, 2024