ChatPaper.aiChatPaper

ReDirector: Criando Retomadas de Vídeo de Qualquer Duração com Codificação de Câmera Rotativa

ReDirector: Creating Any-Length Video Retakes with Rotary Camera Encoding

November 25, 2025
Autores: Byeongjun Park, Byung-Hoon Kim, Hyungjin Chung, Jong Chul Ye
cs.AI

Resumo

Apresentamos o ReDirector, um método inovador de geração de retomas de vídeo controlado por câmera para vídeos de comprimento variável capturados dinamicamente. Especificamente, retificamos um uso inadequado comum da RoPE em trabalhos anteriores, alinhando as posições espaço-temporais do vídeo de entrada e da retoma desejada. Além disso, introduzimos a Codificação Rotacional de Câmera (RoCE), um deslocamento de fase da RoPE condicionado por câmera que captura e integra relações multi-visão dentro e entre os vídeos de entrada e destino. Ao integrar condições de câmera na RoPE, nosso método generaliza para trajetórias de câmera e comprimentos de vídeo fora da distribuição, resultando em uma localização aprimorada de objetos dinâmicos e preservação estática do plano de fundo. Experimentos extensivos demonstram ainda melhorias significativas na controlabilidade da câmera, consistência geométrica e qualidade de vídeo em várias trajetórias e comprimentos.
English
We present ReDirector, a novel camera-controlled video retake generation method for dynamically captured variable-length videos. In particular, we rectify a common misuse of RoPE in previous works by aligning the spatiotemporal positions of the input video and the target retake. Moreover, we introduce Rotary Camera Encoding (RoCE), a camera-conditioned RoPE phase shift that captures and integrates multi-view relationships within and across the input and target videos. By integrating camera conditions into RoPE, our method generalizes to out-of-distribution camera trajectories and video lengths, yielding improved dynamic object localization and static background preservation. Extensive experiments further demonstrate significant improvements in camera controllability, geometric consistency, and video quality across various trajectories and lengths.
PDF112March 24, 2026