ChatPaper.aiChatPaper

4DSloMo : Reconstruction 4D pour des scènes à haute vitesse avec capture asynchrone

4DSloMo: 4D Reconstruction for High Speed Scene with Asynchronous Capture

July 7, 2025
Auteurs: Yutian Chen, Shi Guo, Tianshuo Yang, Lihe Ding, Xiuyuan Yu, Jinwei Gu, Tianfan Xue
cs.AI

Résumé

La reconstruction de scènes à dynamique rapide à partir de vidéos multi-vues est cruciale pour l'analyse de mouvements à haute vitesse et la reconstruction réaliste en 4D. Cependant, la majorité des systèmes de capture 4D sont limités à des fréquences d'images inférieures à 30 FPS (images par seconde), et une reconstruction 4D directe de mouvements à haute vitesse à partir d'une entrée à faible FPS peut conduire à des résultats indésirables. Dans ce travail, nous proposons un système de capture 4D à haute vitesse utilisant uniquement des caméras à faible FPS, grâce à des modules innovants de capture et de traitement. Du côté de la capture, nous proposons un schéma de capture asynchrone qui augmente la fréquence d'images effective en décalant les temps de démarrage des caméras. En regroupant les caméras et en exploitant une fréquence d'images de base de 25 FPS, notre méthode atteint une fréquence d'images équivalente de 100 à 200 FPS sans nécessiter de caméras spécialisées à haute vitesse. Du côté du traitement, nous proposons également un nouveau modèle génératif pour corriger les artefacts causés par la reconstruction 4D à vues éparses, car l'asynchronie réduit le nombre de points de vue à chaque instant. Plus précisément, nous proposons d'entraîner un modèle de correction d'artefacts basé sur la diffusion vidéo pour la reconstruction 4D éparse, qui affine les détails manquants, maintient la cohérence temporelle et améliore la qualité globale de la reconstruction. Les résultats expérimentaux démontrent que notre méthode améliore significativement la reconstruction 4D à haute vitesse par rapport à la capture synchrone.
English
Reconstructing fast-dynamic scenes from multi-view videos is crucial for high-speed motion analysis and realistic 4D reconstruction. However, the majority of 4D capture systems are limited to frame rates below 30 FPS (frames per second), and a direct 4D reconstruction of high-speed motion from low FPS input may lead to undesirable results. In this work, we propose a high-speed 4D capturing system only using low FPS cameras, through novel capturing and processing modules. On the capturing side, we propose an asynchronous capture scheme that increases the effective frame rate by staggering the start times of cameras. By grouping cameras and leveraging a base frame rate of 25 FPS, our method achieves an equivalent frame rate of 100-200 FPS without requiring specialized high-speed cameras. On processing side, we also propose a novel generative model to fix artifacts caused by 4D sparse-view reconstruction, as asynchrony reduces the number of viewpoints at each timestamp. Specifically, we propose to train a video-diffusion-based artifact-fix model for sparse 4D reconstruction, which refines missing details, maintains temporal consistency, and improves overall reconstruction quality. Experimental results demonstrate that our method significantly enhances high-speed 4D reconstruction compared to synchronous capture.
PDF311July 8, 2025