ChatPaper.aiChatPaper

4K4DGen : Génération panoramique 4D en résolution 4K

4K4DGen: Panoramic 4D Generation at 4K Resolution

June 19, 2024
Auteurs: Renjie Li, Panwang Pan, Bangbang Yang, Dejia Xu, Shijie Zhou, Xuanyang Zhang, Zeming Li, Achuta Kadambi, Zhangyang Wang, Zhiwen Fan
cs.AI

Résumé

L'épanouissement des technologies de réalité virtuelle et augmentée (VR/AR) a suscité une demande croissante pour la création d'environnements immersifs, dynamiques et de haute qualité. Cependant, les techniques génératives existantes se concentrent soit uniquement sur les objets dynamiques, soit effectuent un étalement à partir d'une seule image en perspective, ne répondant pas aux besoins des applications VR/AR. Dans ce travail, nous abordons la tâche complexe d'élever une seule image panoramique à une expérience immersive en 4D. Pour la première fois, nous démontrons la capacité à générer des scènes dynamiques omnidirectionnelles avec des vues à 360 degrés en résolution 4K, offrant ainsi une expérience utilisateur immersive. Notre méthode introduit un pipeline qui facilite les animations naturelles de scènes et optimise un ensemble de Gaussiennes 4D en utilisant des techniques de splatting efficaces pour une exploration en temps réel. Pour pallier le manque de données et de modèles annotés 4D à l'échelle de la scène, en particulier dans les formats panoramiques, nous proposons un nouveau Panoramic Denoiser qui adapte des priors de diffusion 2D génériques pour animer de manière cohérente des images à 360 degrés, les transformant en vidéos panoramiques avec des scènes dynamiques dans des régions ciblées. Par la suite, nous élevons la vidéo panoramique à un environnement immersif 4D tout en préservant la cohérence spatiale et temporelle. En transférant les connaissances antérieures des modèles 2D du domaine perspectif au domaine panoramique et en effectuant une élévation 4D avec une régularisation de l'apparence et de la géométrie spatiale, nous atteignons pour la première fois une génération Panorama-to-4D de haute qualité à une résolution de (4096 fois 2048). Consultez le site du projet à l'adresse https://4k4dgen.github.io.
English
The blooming of virtual reality and augmented reality (VR/AR) technologies has driven an increasing demand for the creation of high-quality, immersive, and dynamic environments. However, existing generative techniques either focus solely on dynamic objects or perform outpainting from a single perspective image, failing to meet the needs of VR/AR applications. In this work, we tackle the challenging task of elevating a single panorama to an immersive 4D experience. For the first time, we demonstrate the capability to generate omnidirectional dynamic scenes with 360-degree views at 4K resolution, thereby providing an immersive user experience. Our method introduces a pipeline that facilitates natural scene animations and optimizes a set of 4D Gaussians using efficient splatting techniques for real-time exploration. To overcome the lack of scene-scale annotated 4D data and models, especially in panoramic formats, we propose a novel Panoramic Denoiser that adapts generic 2D diffusion priors to animate consistently in 360-degree images, transforming them into panoramic videos with dynamic scenes at targeted regions. Subsequently, we elevate the panoramic video into a 4D immersive environment while preserving spatial and temporal consistency. By transferring prior knowledge from 2D models in the perspective domain to the panoramic domain and the 4D lifting with spatial appearance and geometry regularization, we achieve high-quality Panorama-to-4D generation at a resolution of (4096 times 2048) for the first time. See the project website at https://4k4dgen.github.io.

Summary

AI-Generated Summary

PDF81November 29, 2024