Spatia: Videogeneratie met bijwerkbaar ruimtelijk geheugen

Samenvatting

Bestaande videogeneratiemodellen hebben moeite met het behouden van langdurige ruimtelijke en temporele consistentie vanwege de dichte, hoogdimensionale aard van videosignalen. Om deze beperking te overwinnen, stellen we Spatia voor, een ruimtelijk geheugenbewust videogeneratiekader dat expliciet een 3D-scenepuntwolk als persistent ruimtelijk geheugen bewaart. Spatia genereert iteratief videofragmenten op basis van dit ruimtelijk geheugen en werkt het continu bij via visuele SLAM. Dit dynamisch-statische ontvlechtingso

English

Existing video generation models struggle to maintain long-term spatial and temporal consistency due to the dense, high-dimensional nature of video signals. To overcome this limitation, we propose Spatia, a spatial memory-aware video generation framework that explicitly preserves a 3D scene point cloud as persistent spatial memory. Spatia iteratively generates video clips conditioned on this spatial memory and continuously updates it through visual SLAM. This dynamic-static disentanglement design enhances spatial consistency throughout the generation process while preserving the model's ability to produce realistic dynamic entities. Furthermore, Spatia enables applications such as explicit camera control and 3D-aware interactive editing, providing a geometrically grounded framework for scalable, memory-driven video generation.

Spatia: Videogeneratie met bijwerkbaar ruimtelijk geheugen

Spatia: Video Generation with Updatable Spatial Memory

Samenvatting

Support