ChatPaper.aiChatPaper

Rauschkalibrierung: Plug-and-Play-Inhaltsbewahrung bei der Videoverbesserung unter Verwendung von vorab trainierten Videodiffusionsmodellen

Noise Calibration: Plug-and-play Content-Preserving Video Enhancement using Pre-trained Video Diffusion Models

July 14, 2024
Autoren: Qinyu Yang, Haoxin Chen, Yong Zhang, Menghan Xia, Xiaodong Cun, Zhixun Su, Ying Shan
cs.AI

Zusammenfassung

Um die Qualität synthetisierter Videos zu verbessern, involviert derzeit eine vorherrschende Methode das Neutrainieren eines Experten-Diffusionsmodells und die Implementierung eines Rausch-Entfernung-Prozesses zur Verfeinerung. Trotz der signifikanten Trainingskosten bleibt die Aufrechterhaltung der Konsistenz des Inhalts zwischen den Original- und verbesserten Videos eine große Herausforderung. Um diese Herausforderung anzugehen, schlagen wir eine neuartige Formulierung vor, die sowohl die visuelle Qualität als auch die Konsistenz des Inhalts berücksichtigt. Die Konsistenz des Inhalts wird durch eine vorgeschlagene Verlustfunktion sichergestellt, die die Struktur des Eingangs beibehält, während die visuelle Qualität durch die Nutzung des Rausch-Entfernung-Prozesses vortrainierter Diffusionsmodelle verbessert wird. Um das formulierte Optimierungsproblem anzugehen, haben wir eine Plug-and-Play-Rauschoptimierungsstrategie entwickelt, die als Rauschkalibrierung bezeichnet wird. Durch die Verfeinerung des anfänglichen zufälligen Rauschens über einige Iterationen hinweg kann der Inhalt des Originalvideos weitgehend erhalten bleiben, und der Verbesserungseffekt zeigt eine bemerkenswerte Verbesserung. Umfangreiche Experimente haben die Wirksamkeit der vorgeschlagenen Methode gezeigt.
English
In order to improve the quality of synthesized videos, currently, one predominant method involves retraining an expert diffusion model and then implementing a noising-denoising process for refinement. Despite the significant training costs, maintaining consistency of content between the original and enhanced videos remains a major challenge. To tackle this challenge, we propose a novel formulation that considers both visual quality and consistency of content. Consistency of content is ensured by a proposed loss function that maintains the structure of the input, while visual quality is improved by utilizing the denoising process of pretrained diffusion models. To address the formulated optimization problem, we have developed a plug-and-play noise optimization strategy, referred to as Noise Calibration. By refining the initial random noise through a few iterations, the content of original video can be largely preserved, and the enhancement effect demonstrates a notable improvement. Extensive experiments have demonstrated the effectiveness of the proposed method.

Summary

AI-Generated Summary

PDF52November 28, 2024