ChatPaper.aiChatPaper

ReDirector : Création de retakes vidéo de longueur arbitraire avec encodage rotatif de caméra

ReDirector: Creating Any-Length Video Retakes with Rotary Camera Encoding

November 25, 2025
papers.authors: Byeongjun Park, Byung-Hoon Kim, Hyungjin Chung, Jong Chul Ye
cs.AI

papers.abstract

Nous présentons ReDirector, une nouvelle méthode de génération de reprises vidéo contrôlée par caméra pour des vidéos de longueur variable capturées dynamiquement. En particulier, nous rectifions une utilisation erronée courante de RoPE dans les travaux antérieurs en alignant les positions spatiotemporelles de la vidéo d'entrée et de la reprise cible. De plus, nous introduisons le codage rotatif de caméra (RoCE), un déphasage RoPE conditionné par la caméra qui capture et intègre les relations multi-vues au sein et entre les vidéos d'entrée et cibles. En intégrant les conditions de caméra dans RoPE, notre méthode se généralise à des trajectoires de caméra et des longueurs de vidéo hors distribution, produisant une amélioration de la localisation dynamique des objets et de la préservation de l'arrière-plan statique. Des expériences approfondies démontrent en outre des améliorations significatives de la contrôlabilité de la caméra, de la cohérence géométrique et de la qualité vidéo sur diverses trajectoires et longueurs.
English
We present ReDirector, a novel camera-controlled video retake generation method for dynamically captured variable-length videos. In particular, we rectify a common misuse of RoPE in previous works by aligning the spatiotemporal positions of the input video and the target retake. Moreover, we introduce Rotary Camera Encoding (RoCE), a camera-conditioned RoPE phase shift that captures and integrates multi-view relationships within and across the input and target videos. By integrating camera conditions into RoPE, our method generalizes to out-of-distribution camera trajectories and video lengths, yielding improved dynamic object localization and static background preservation. Extensive experiments further demonstrate significant improvements in camera controllability, geometric consistency, and video quality across various trajectories and lengths.
PDF112December 1, 2025