MoVieS: Síntesis Dinámica de Vistas 4D con Conciencia del Movimiento en un Segundo

Resumen

Presentamos MoVieS, un modelo novedoso de propagación directa que sintetiza vistas dinámicas 4D a partir de videos monoculares en un segundo. MoVieS representa escenas 3D dinámicas utilizando mallas alineadas por píxeles de primitivas gaussianas, supervisando explícitamente su movimiento variable en el tiempo. Esto permite, por primera vez, el modelado unificado de apariencia, geometría y movimiento, y habilita la síntesis de vistas, la reconstrucción y el seguimiento de puntos 3D dentro de un único marco basado en aprendizaje. Al conectar la síntesis de vistas novedosas con la reconstrucción de geometría dinámica, MoVieS posibilita el entrenamiento a gran escala en diversos conjuntos de datos con una dependencia mínima de supervisión específica de tareas. Como resultado, también admite de manera natural una amplia gama de aplicaciones de cero disparos, como la estimación de flujo de escena y la segmentación de objetos en movimiento. Experimentos exhaustivos validan la eficacia y eficiencia de MoVieS en múltiples tareas, logrando un rendimiento competitivo mientras ofrece aceleraciones de varios órdenes de magnitud.

English

We present MoVieS, a novel feed-forward model that synthesizes 4D dynamic novel views from monocular videos in one second. MoVieS represents dynamic 3D scenes using pixel-aligned grids of Gaussian primitives, explicitly supervising their time-varying motion. This allows, for the first time, the unified modeling of appearance, geometry and motion, and enables view synthesis, reconstruction and 3D point tracking within a single learning-based framework. By bridging novel view synthesis with dynamic geometry reconstruction, MoVieS enables large-scale training on diverse datasets with minimal dependence on task-specific supervision. As a result, it also naturally supports a wide range of zero-shot applications, such as scene flow estimation and moving object segmentation. Extensive experiments validate the effectiveness and efficiency of MoVieS across multiple tasks, achieving competitive performance while offering several orders of magnitude speedups.

MoVieS: Síntesis Dinámica de Vistas 4D con Conciencia del Movimiento en un Segundo

MoVieS: Motion-Aware 4D Dynamic View Synthesis in One Second

Resumen

Support