DyBluRF: Campos de Radiação Neural Dinâmicos para Remoção de Desfoque em Vídeo Monocular com Desfoque

Resumo

A síntese de visão de vídeo, permitindo a criação de quadros visualmente atraentes a partir de pontos de vista e tempos arbitrários, oferece experiências de visualização imersivas. Os campos de radiação neural, particularmente o NeRF, inicialmente desenvolvidos para cenas estáticas, impulsionaram a criação de diversos métodos para síntese de visão de vídeo. No entanto, o desafio para a síntese de visão de vídeo surge do borrão de movimento, uma consequência do movimento do objeto ou da câmera durante a exposição, o que dificulta a síntese precisa de visões espaço-temporais nítidas. Em resposta, propomos uma nova estrutura de NeRF dinâmico para desborramento de vídeo monocromático borrado, chamada DyBluRF, composta por uma etapa de Refinamento de Raios Intercalados (IRR) e uma etapa de Desborramento Baseado em Decomposição de Movimento (MDD). Nosso DyBluRF é o primeiro que aborda e lida com a síntese de novas visões para vídeo monocromático borrado. A etapa IRR reconstrói conjuntamente cenas 3D dinâmicas e refina as informações imprecisas da pose da câmera para combater as informações de pose inexatas extraídas dos quadros borrados fornecidos. A etapa MDD é uma nova abordagem de previsão incremental de raios nítidos latentes (ILSP) para os quadros de vídeo monocromático borrado, decompondo os raios nítidos latentes em componentes de movimento global da câmera e movimento local do objeto. Resultados experimentais extensivos demonstram que nosso DyBluRF supera qualitativamente e quantitativamente os métodos mais recentes e avançados. Nossa página do projeto, incluindo códigos-fonte e modelo pré-treinado, está publicamente disponível em https://kaist-viclab.github.io/dyblurf-site/.

English

Video view synthesis, allowing for the creation of visually appealing frames from arbitrary viewpoints and times, offers immersive viewing experiences. Neural radiance fields, particularly NeRF, initially developed for static scenes, have spurred the creation of various methods for video view synthesis. However, the challenge for video view synthesis arises from motion blur, a consequence of object or camera movement during exposure, which hinders the precise synthesis of sharp spatio-temporal views. In response, we propose a novel dynamic deblurring NeRF framework for blurry monocular video, called DyBluRF, consisting of an Interleave Ray Refinement (IRR) stage and a Motion Decomposition-based Deblurring (MDD) stage. Our DyBluRF is the first that addresses and handles the novel view synthesis for blurry monocular video. The IRR stage jointly reconstructs dynamic 3D scenes and refines the inaccurate camera pose information to combat imprecise pose information extracted from the given blurry frames. The MDD stage is a novel incremental latent sharp-rays prediction (ILSP) approach for the blurry monocular video frames by decomposing the latent sharp rays into global camera motion and local object motion components. Extensive experimental results demonstrate that our DyBluRF outperforms qualitatively and quantitatively the very recent state-of-the-art methods. Our project page including source codes and pretrained model are publicly available at https://kaist-viclab.github.io/dyblurf-site/.

DyBluRF: Campos de Radiação Neural Dinâmicos para Remoção de Desfoque em Vídeo Monocular com Desfoque

DyBluRF: Dynamic Deblurring Neural Radiance Fields for Blurry Monocular Video

Resumo

Support