ChatPaper.aiChatPaper

卓越へとスケールアップ:実世界におけるフォトリアリスティックな画像復元のためのモデルスケーリング実践

Scaling Up to Excellence: Practicing Model Scaling for Photo-Realistic Image Restoration In the Wild

January 24, 2024
著者: Fanghua Yu, Jinjin Gu, Zheyuan Li, Jinfan Hu, Xiangtao Kong, Xintao Wang, Jingwen He, Yu Qiao, Chao Dong
cs.AI

要旨

本論文では、生成事前分布とモデルスケーリングの力を活用した画期的な画像復元手法であるSUPIR(Scaling-UP Image Restoration)を紹介します。マルチモーダル技術と高度な生成事前分布を活用することで、SUPIRは知的で現実的な画像復元において大きな進歩を遂げています。SUPIRの中核となるモデルスケーリングは、その能力を劇的に向上させ、画像復元における新たな可能性を示しています。モデルトレーニングのために、2000万枚の高解像度・高品質な画像からなるデータセットを収集し、それぞれに記述的なテキストアノテーションを付与しました。SUPIRは、テキストプロンプトに基づいて画像を復元する能力を提供し、その応用範囲と可能性を広げています。さらに、知覚品質をさらに向上させるために、ネガティブ品質プロンプトを導入しました。また、生成ベースの復元で遭遇する忠実度の問題を抑制するために、復元ガイド付きサンプリング手法を開発しました。実験結果は、SUPIRの卓越した復元効果と、テキストプロンプトを通じて復元を操作する新たな能力を実証しています。
English
We introduce SUPIR (Scaling-UP Image Restoration), a groundbreaking image restoration method that harnesses generative prior and the power of model scaling up. Leveraging multi-modal techniques and advanced generative prior, SUPIR marks a significant advance in intelligent and realistic image restoration. As a pivotal catalyst within SUPIR, model scaling dramatically enhances its capabilities and demonstrates new potential for image restoration. We collect a dataset comprising 20 million high-resolution, high-quality images for model training, each enriched with descriptive text annotations. SUPIR provides the capability to restore images guided by textual prompts, broadening its application scope and potential. Moreover, we introduce negative-quality prompts to further improve perceptual quality. We also develop a restoration-guided sampling method to suppress the fidelity issue encountered in generative-based restoration. Experiments demonstrate SUPIR's exceptional restoration effects and its novel capacity to manipulate restoration through textual prompts.
PDF7515December 15, 2024