Calibración de Ruido: Mejora de Video Preservando el Contenido con Conexión Automática utilizando Modelos de Difusión de Video Pre-entrenados
Noise Calibration: Plug-and-play Content-Preserving Video Enhancement using Pre-trained Video Diffusion Models
July 14, 2024
Autores: Qinyu Yang, Haoxin Chen, Yong Zhang, Menghan Xia, Xiaodong Cun, Zhixun Su, Ying Shan
cs.AI
Resumen
Con el fin de mejorar la calidad de los videos sintetizados, actualmente, un método predominante implica el reentrenamiento de un modelo de difusión experto y luego la implementación de un proceso de ruido-denoising para el refinamiento. A pesar de los significativos costos de entrenamiento, mantener la consistencia de contenido entre los videos originales y mejorados sigue siendo un desafío importante. Para abordar este desafío, proponemos una formulación novedosa que considera tanto la calidad visual como la consistencia de contenido. La consistencia de contenido se garantiza mediante una función de pérdida propuesta que mantiene la estructura de la entrada, mientras que la calidad visual se mejora utilizando el proceso de denoising de modelos de difusión preentrenados. Para abordar el problema de optimización formulado, hemos desarrollado una estrategia de optimización de ruido plug-and-play, denominada Calibración de Ruido. Al refinar el ruido aleatorio inicial a través de algunas iteraciones, el contenido del video original puede preservarse en gran medida, y el efecto de mejora muestra una notable mejora. Experimentos extensos han demostrado la efectividad del método propuesto.
English
In order to improve the quality of synthesized videos, currently, one
predominant method involves retraining an expert diffusion model and then
implementing a noising-denoising process for refinement. Despite the
significant training costs, maintaining consistency of content between the
original and enhanced videos remains a major challenge. To tackle this
challenge, we propose a novel formulation that considers both visual quality
and consistency of content. Consistency of content is ensured by a proposed
loss function that maintains the structure of the input, while visual quality
is improved by utilizing the denoising process of pretrained diffusion models.
To address the formulated optimization problem, we have developed a
plug-and-play noise optimization strategy, referred to as Noise Calibration. By
refining the initial random noise through a few iterations, the content of
original video can be largely preserved, and the enhancement effect
demonstrates a notable improvement. Extensive experiments have demonstrated the
effectiveness of the proposed method.Summary
AI-Generated Summary