ReDirector: Creazione di Riprese Video di Qualsiasi Durata con Codifica Rotazionale della Fotocamera
ReDirector: Creating Any-Length Video Retakes with Rotary Camera Encoding
November 25, 2025
Autori: Byeongjun Park, Byung-Hoon Kim, Hyungjin Chung, Jong Chul Ye
cs.AI
Abstract
Presentiamo ReDirector, un metodo innovativo per la generazione di riprese alternative controllate dalla telecamera per video a lunghezza variabile acquisiti dinamicamente. In particolare, correggiamo un comune uso improprio di RoPE nei lavori precedenti allineando le posizioni spazio-temporali del video di input e della ripresa alternativa target. Inoltre, introduciamo la Rotary Camera Encoding (RoCE), uno sfasamento di fase RoPE condizionato dalla telecamera che cattura e integra le relazioni multi-vista all'interno e tra i video di input e target. Integrando le condizioni della telecamera in RoPE, il nostro metodo si generalizza a traiettorie della telecamera e lunghezze video fuori distribuzione, producendo un miglioramento della localizzazione dinamica degli oggetti e della preservazione dello sfondo statico. Esperimenti estensivi dimostrano ulteriormente significativi miglioramenti nella controllabilità della telecamera, nella consistenza geometrica e nella qualità video attraverso varie traiettorie e lunghezze.
English
We present ReDirector, a novel camera-controlled video retake generation method for dynamically captured variable-length videos. In particular, we rectify a common misuse of RoPE in previous works by aligning the spatiotemporal positions of the input video and the target retake. Moreover, we introduce Rotary Camera Encoding (RoCE), a camera-conditioned RoPE phase shift that captures and integrates multi-view relationships within and across the input and target videos. By integrating camera conditions into RoPE, our method generalizes to out-of-distribution camera trajectories and video lengths, yielding improved dynamic object localization and static background preservation. Extensive experiments further demonstrate significant improvements in camera controllability, geometric consistency, and video quality across various trajectories and lengths.