ChatPaper.aiChatPaper

Imagine360: Geração de Vídeo Imersivo em 360 Graus a partir de Âncora de Perspectiva

Imagine360: Immersive 360 Video Generation from Perspective Anchor

December 4, 2024
Autores: Jing Tan, Shuai Yang, Tong Wu, Jingwen He, Yuwei Guo, Ziwei Liu, Dahua Lin
cs.AI

Resumo

Vídeos de 360^circ oferecem uma experiência hiperimersiva que permite aos espectadores explorar uma cena dinâmica em 360 graus completos. Para alcançar uma criação de conteúdo mais amigável ao usuário e personalizada no formato de vídeo de 360^circ, buscamos transformar vídeos de perspectiva padrão em vídeos de 360^circ equiretangulares. Para isso, apresentamos o Imagine360, o primeiro framework de geração de vídeos de perspectiva para 360^circ que cria vídeos de alta qualidade com padrões de movimento ricos e diversos a partir de âncoras de vídeo. O Imagine360 aprende padrões visuais e de movimento esféricos detalhados a partir de dados limitados de vídeos de 360^circ com várias estratégias-chave. 1) Primeiramente, adotamos o design de duplo ramo, incluindo um ramo de denoising de vídeo de perspectiva e um de panorama para fornecer restrições locais e globais para a geração de vídeos de 360^circ, com módulo de movimento e camadas espaciais LoRA ajustadas em vídeos de 360^circ da web estendida. 2) Adicionalmente, uma máscara antipodal é desenvolvida para capturar dependências de movimento de longo alcance, aprimorando o movimento da câmera invertida entre pixels antipodais em hemisférios opostos. 3) Para lidar com diversas entradas de vídeo de perspectiva, propomos designs sensíveis à elevação que se adaptam a máscaras de vídeo variáveis devido a mudanças de elevação entre quadros. Experimentos extensivos mostram que o Imagine360 alcança qualidade gráfica superior e coerência de movimento entre os métodos de geração de vídeo de 360^circ de última geração. Acreditamos que o Imagine360 tem potencial para avançar na criação de vídeos de 360^circ imersivos e personalizados.
English
360^circ videos offer a hyper-immersive experience that allows the viewers to explore a dynamic scene from full 360 degrees. To achieve more user-friendly and personalized content creation in 360^circ video format, we seek to lift standard perspective videos into 360^circ equirectangular videos. To this end, we introduce Imagine360, the first perspective-to-360^circ video generation framework that creates high-quality 360^circ videos with rich and diverse motion patterns from video anchors. Imagine360 learns fine-grained spherical visual and motion patterns from limited 360^circ video data with several key designs. 1) Firstly we adopt the dual-branch design, including a perspective and a panorama video denoising branch to provide local and global constraints for 360^circ video generation, with motion module and spatial LoRA layers fine-tuned on extended web 360^circ videos. 2) Additionally, an antipodal mask is devised to capture long-range motion dependencies, enhancing the reversed camera motion between antipodal pixels across hemispheres. 3) To handle diverse perspective video inputs, we propose elevation-aware designs that adapt to varying video masking due to changing elevations across frames. Extensive experiments show Imagine360 achieves superior graphics quality and motion coherence among state-of-the-art 360^circ video generation methods. We believe Imagine360 holds promise for advancing personalized, immersive 360^circ video creation.

Summary

AI-Generated Summary

PDF292December 5, 2024