ChatPaper.aiChatPaper

Degradationsgesteuerte Ein-Schritt-Bild-Superauflösung mit Diffusionsprioritäten

Degradation-Guided One-Step Image Super-Resolution with Diffusion Priors

September 25, 2024
papers.authors: Aiping Zhang, Zongsheng Yue, Renjing Pei, Wenqi Ren, Xiaochun Cao
cs.AI

papers.abstract

Diffusionsbasierte Bild-Superauflösungsmethoden haben bemerkenswerte Erfolge erzielt, indem sie große vortrainierte Text-zu-Bild-Diffusionsmodelle als Priors nutzen. Dennoch stehen diese Methoden vor zwei Herausforderungen: dem Erfordernis von Dutzenden von Abtastschritten, um zufriedenstellende Ergebnisse zu erzielen, was die Effizienz in realen Szenarien einschränkt, und der Vernachlässigung von Degradationsmodellen, die entscheidende Hilfsinformationen bei der Lösung des Superauflösungsproblems sind. In dieser Arbeit haben wir ein neuartiges Ein-Schritt-SR-Modell vorgestellt, das das Effizienzproblem von diffusionsbasierten SR-Methoden signifikant angeht. Anders als bestehende Feinabstimmungsstrategien haben wir ein Degradations-geführtes Low-Rank-Adaptations (LoRA)-Modul speziell für SR entworfen, das die Modellparameter basierend auf den vorab geschätzten Degradationsinformationen aus Niedrigauflösungsbildern korrigiert. Dieses Modul erleichtert nicht nur ein leistungsstarkes datenabhängiges oder degradationsabhängiges SR-Modell, sondern bewahrt auch den generativen Prior des vortrainierten Diffusionsmodells so weit wie möglich. Darüber hinaus haben wir eine neuartige Trainingspipeline maßgeschneidert, indem wir eine Online-Negativstichprobenerzeugungsstrategie einführen. In Kombination mit der klassifiziererfreien Leitstrategie während der Inferenz verbessert dies weitgehend die perzeptuelle Qualität der Superauflösungsergebnisse. Umfangreiche Experimente haben die überlegene Effizienz und Wirksamkeit des vorgeschlagenen Modells im Vergleich zu aktuellen State-of-the-Art-Methoden nachgewiesen.
English
Diffusion-based image super-resolution (SR) methods have achieved remarkable success by leveraging large pre-trained text-to-image diffusion models as priors. However, these methods still face two challenges: the requirement for dozens of sampling steps to achieve satisfactory results, which limits efficiency in real scenarios, and the neglect of degradation models, which are critical auxiliary information in solving the SR problem. In this work, we introduced a novel one-step SR model, which significantly addresses the efficiency issue of diffusion-based SR methods. Unlike existing fine-tuning strategies, we designed a degradation-guided Low-Rank Adaptation (LoRA) module specifically for SR, which corrects the model parameters based on the pre-estimated degradation information from low-resolution images. This module not only facilitates a powerful data-dependent or degradation-dependent SR model but also preserves the generative prior of the pre-trained diffusion model as much as possible. Furthermore, we tailor a novel training pipeline by introducing an online negative sample generation strategy. Combined with the classifier-free guidance strategy during inference, it largely improves the perceptual quality of the super-resolution results. Extensive experiments have demonstrated the superior efficiency and effectiveness of the proposed model compared to recent state-of-the-art methods.
PDF135November 16, 2024