ChatPaper.aiChatPaper

Spatia: Geração de Vídeo com Memória Espacial Atualizável

Spatia: Video Generation with Updatable Spatial Memory

December 17, 2025
Autores: Jinjing Zhao, Fangyun Wei, Zhening Liu, Hongyang Zhang, Chang Xu, Yan Lu
cs.AI

Resumo

Os modelos existentes de geração de vídeo enfrentam dificuldades em manter a consistência espacial e temporal de longo prazo devido à natureza densa e de alta dimensão dos sinais de vídeo. Para superar essa limitação, propomos o Spatia, uma estrutura de geração de vídeo com memória espacial que preserva explicitamente uma nuvem de pontos 3D da cena como memória espacial persistente. O Spatia gera iterativamente clipes de vídeo condicionados a essa memória espacial e a atualiza continuamente por meio de SLAM visual. Este design de separação dinâmico-estática melhora a consistência espacial ao longo do processo de geração, preservando a capacidade do modelo de produzir entidades dinâmicas realistas. Além disso, o Spatia permite aplicações como controle explícito de câmera e edição interativa com consciência 3D, fornecendo uma estrutura geometricamente fundamentada para geração de vídeo escalável e orientada por memória.
English
Existing video generation models struggle to maintain long-term spatial and temporal consistency due to the dense, high-dimensional nature of video signals. To overcome this limitation, we propose Spatia, a spatial memory-aware video generation framework that explicitly preserves a 3D scene point cloud as persistent spatial memory. Spatia iteratively generates video clips conditioned on this spatial memory and continuously updates it through visual SLAM. This dynamic-static disentanglement design enhances spatial consistency throughout the generation process while preserving the model's ability to produce realistic dynamic entities. Furthermore, Spatia enables applications such as explicit camera control and 3D-aware interactive editing, providing a geometrically grounded framework for scalable, memory-driven video generation.
PDF334February 7, 2026