Rauschkalibrierung: Plug-and-Play-Inhaltsbewahrung bei der Videoverbesserung unter Verwendung von vorab trainierten Videodiffusionsmodellen
Noise Calibration: Plug-and-play Content-Preserving Video Enhancement using Pre-trained Video Diffusion Models
July 14, 2024
Autoren: Qinyu Yang, Haoxin Chen, Yong Zhang, Menghan Xia, Xiaodong Cun, Zhixun Su, Ying Shan
cs.AI
Zusammenfassung
Um die Qualität synthetisierter Videos zu verbessern, involviert derzeit eine vorherrschende Methode das Neutrainieren eines Experten-Diffusionsmodells und die Implementierung eines Rausch-Entfernung-Prozesses zur Verfeinerung. Trotz der signifikanten Trainingskosten bleibt die Aufrechterhaltung der Konsistenz des Inhalts zwischen den Original- und verbesserten Videos eine große Herausforderung. Um diese Herausforderung anzugehen, schlagen wir eine neuartige Formulierung vor, die sowohl die visuelle Qualität als auch die Konsistenz des Inhalts berücksichtigt. Die Konsistenz des Inhalts wird durch eine vorgeschlagene Verlustfunktion sichergestellt, die die Struktur des Eingangs beibehält, während die visuelle Qualität durch die Nutzung des Rausch-Entfernung-Prozesses vortrainierter Diffusionsmodelle verbessert wird. Um das formulierte Optimierungsproblem anzugehen, haben wir eine Plug-and-Play-Rauschoptimierungsstrategie entwickelt, die als Rauschkalibrierung bezeichnet wird. Durch die Verfeinerung des anfänglichen zufälligen Rauschens über einige Iterationen hinweg kann der Inhalt des Originalvideos weitgehend erhalten bleiben, und der Verbesserungseffekt zeigt eine bemerkenswerte Verbesserung. Umfangreiche Experimente haben die Wirksamkeit der vorgeschlagenen Methode gezeigt.
English
In order to improve the quality of synthesized videos, currently, one
predominant method involves retraining an expert diffusion model and then
implementing a noising-denoising process for refinement. Despite the
significant training costs, maintaining consistency of content between the
original and enhanced videos remains a major challenge. To tackle this
challenge, we propose a novel formulation that considers both visual quality
and consistency of content. Consistency of content is ensured by a proposed
loss function that maintains the structure of the input, while visual quality
is improved by utilizing the denoising process of pretrained diffusion models.
To address the formulated optimization problem, we have developed a
plug-and-play noise optimization strategy, referred to as Noise Calibration. By
refining the initial random noise through a few iterations, the content of
original video can be largely preserved, and the enhancement effect
demonstrates a notable improvement. Extensive experiments have demonstrated the
effectiveness of the proposed method.Summary
AI-Generated Summary