ChatPaper.aiChatPaper

Passer à l'échelle pour l'excellence : Pratique de la mise à l'échelle des modèles pour la restauration photo-réaliste d'images en conditions réelles

Scaling Up to Excellence: Practicing Model Scaling for Photo-Realistic Image Restoration In the Wild

January 24, 2024
Auteurs: Fanghua Yu, Jinjin Gu, Zheyuan Li, Jinfan Hu, Xiangtao Kong, Xintao Wang, Jingwen He, Yu Qiao, Chao Dong
cs.AI

Résumé

Nous présentons SUPIR (Scaling-UP Image Restoration), une méthode révolutionnaire de restauration d'images qui exploite un a priori génératif et la puissance de la mise à l'échelle des modèles. En s'appuyant sur des techniques multimodales et un a priori génératif avancé, SUPIR marque une avancée significative dans la restauration d'images intelligente et réaliste. En tant que catalyseur central au sein de SUPIR, la mise à l'échelle des modèles améliore considérablement ses capacités et démontre un nouveau potentiel pour la restauration d'images. Nous avons constitué un ensemble de données comprenant 20 millions d'images haute résolution et de haute qualité pour l'entraînement du modèle, chacune enrichie d'annotations textuelles descriptives. SUPIR offre la possibilité de restaurer des images guidées par des invites textuelles, élargissant ainsi son champ d'application et son potentiel. De plus, nous introduisons des invites de qualité négative pour améliorer davantage la qualité perceptuelle. Nous développons également une méthode d'échantillonnage guidée par la restauration pour atténuer le problème de fidélité rencontré dans la restauration basée sur la génération. Les expériences démontrent les effets de restauration exceptionnels de SUPIR ainsi que sa capacité novatrice à manipuler la restauration via des invites textuelles.
English
We introduce SUPIR (Scaling-UP Image Restoration), a groundbreaking image restoration method that harnesses generative prior and the power of model scaling up. Leveraging multi-modal techniques and advanced generative prior, SUPIR marks a significant advance in intelligent and realistic image restoration. As a pivotal catalyst within SUPIR, model scaling dramatically enhances its capabilities and demonstrates new potential for image restoration. We collect a dataset comprising 20 million high-resolution, high-quality images for model training, each enriched with descriptive text annotations. SUPIR provides the capability to restore images guided by textual prompts, broadening its application scope and potential. Moreover, we introduce negative-quality prompts to further improve perceptual quality. We also develop a restoration-guided sampling method to suppress the fidelity issue encountered in generative-based restoration. Experiments demonstrate SUPIR's exceptional restoration effects and its novel capacity to manipulate restoration through textual prompts.
PDF7515December 15, 2024