ChatPaper.aiChatPaper

4DSloMo: Reconstrução 4D para Cenas de Alta Velocidade com Captura Assíncrona

4DSloMo: 4D Reconstruction for High Speed Scene with Asynchronous Capture

July 7, 2025
Autores: Yutian Chen, Shi Guo, Tianshuo Yang, Lihe Ding, Xiuyuan Yu, Jinwei Gu, Tianfan Xue
cs.AI

Resumo

Reconstruir cenas de movimento rápido a partir de vídeos multiview é crucial para a análise de movimentos em alta velocidade e a reconstrução realista em 4D. No entanto, a maioria dos sistemas de captura 4D está limitada a taxas de quadros abaixo de 30 FPS (quadros por segundo), e uma reconstrução 4D direta de movimentos em alta velocidade a partir de entradas de baixa taxa de quadros pode resultar em efeitos indesejáveis. Neste trabalho, propomos um sistema de captura 4D em alta velocidade utilizando apenas câmeras de baixa taxa de quadros, por meio de módulos inovadores de captura e processamento. No lado da captura, propomos um esquema de captura assíncrona que aumenta a taxa de quadros efetiva ao escalonar os tempos de início das câmeras. Ao agrupar câmeras e aproveitar uma taxa de quadros base de 25 FPS, nosso método alcança uma taxa de quadros equivalente de 100-200 FPS sem a necessidade de câmeras especializadas de alta velocidade. No lado do processamento, também propomos um novo modelo generativo para corrigir artefatos causados pela reconstrução 4D de visão esparsa, já que a assincronia reduz o número de pontos de vista em cada instante de tempo. Especificamente, propomos treinar um modelo de correção de artefatos baseado em difusão de vídeo para reconstrução 4D esparsa, que refina detalhes ausentes, mantém a consistência temporal e melhora a qualidade geral da reconstrução. Resultados experimentais demonstram que nosso método aprimora significativamente a reconstrução 4D em alta velocidade em comparação com a captura síncrona.
English
Reconstructing fast-dynamic scenes from multi-view videos is crucial for high-speed motion analysis and realistic 4D reconstruction. However, the majority of 4D capture systems are limited to frame rates below 30 FPS (frames per second), and a direct 4D reconstruction of high-speed motion from low FPS input may lead to undesirable results. In this work, we propose a high-speed 4D capturing system only using low FPS cameras, through novel capturing and processing modules. On the capturing side, we propose an asynchronous capture scheme that increases the effective frame rate by staggering the start times of cameras. By grouping cameras and leveraging a base frame rate of 25 FPS, our method achieves an equivalent frame rate of 100-200 FPS without requiring specialized high-speed cameras. On processing side, we also propose a novel generative model to fix artifacts caused by 4D sparse-view reconstruction, as asynchrony reduces the number of viewpoints at each timestamp. Specifically, we propose to train a video-diffusion-based artifact-fix model for sparse 4D reconstruction, which refines missing details, maintains temporal consistency, and improves overall reconstruction quality. Experimental results demonstrate that our method significantly enhances high-speed 4D reconstruction compared to synchronous capture.
PDF392July 8, 2025