ChatPaper.aiChatPaper

Calibración de Ruido: Mejora de Video Preservando el Contenido con Conexión Automática utilizando Modelos de Difusión de Video Pre-entrenados

Noise Calibration: Plug-and-play Content-Preserving Video Enhancement using Pre-trained Video Diffusion Models

July 14, 2024
Autores: Qinyu Yang, Haoxin Chen, Yong Zhang, Menghan Xia, Xiaodong Cun, Zhixun Su, Ying Shan
cs.AI

Resumen

Con el fin de mejorar la calidad de los videos sintetizados, actualmente, un método predominante implica el reentrenamiento de un modelo de difusión experto y luego la implementación de un proceso de ruido-denoising para el refinamiento. A pesar de los significativos costos de entrenamiento, mantener la consistencia de contenido entre los videos originales y mejorados sigue siendo un desafío importante. Para abordar este desafío, proponemos una formulación novedosa que considera tanto la calidad visual como la consistencia de contenido. La consistencia de contenido se garantiza mediante una función de pérdida propuesta que mantiene la estructura de la entrada, mientras que la calidad visual se mejora utilizando el proceso de denoising de modelos de difusión preentrenados. Para abordar el problema de optimización formulado, hemos desarrollado una estrategia de optimización de ruido plug-and-play, denominada Calibración de Ruido. Al refinar el ruido aleatorio inicial a través de algunas iteraciones, el contenido del video original puede preservarse en gran medida, y el efecto de mejora muestra una notable mejora. Experimentos extensos han demostrado la efectividad del método propuesto.
English
In order to improve the quality of synthesized videos, currently, one predominant method involves retraining an expert diffusion model and then implementing a noising-denoising process for refinement. Despite the significant training costs, maintaining consistency of content between the original and enhanced videos remains a major challenge. To tackle this challenge, we propose a novel formulation that considers both visual quality and consistency of content. Consistency of content is ensured by a proposed loss function that maintains the structure of the input, while visual quality is improved by utilizing the denoising process of pretrained diffusion models. To address the formulated optimization problem, we have developed a plug-and-play noise optimization strategy, referred to as Noise Calibration. By refining the initial random noise through a few iterations, the content of original video can be largely preserved, and the enhancement effect demonstrates a notable improvement. Extensive experiments have demonstrated the effectiveness of the proposed method.

Summary

AI-Generated Summary

PDF52November 28, 2024