ChatPaper.aiChatPaper

Масштабирование к совершенству: практика масштабирования моделей для фотореалистичного восстановления изображений в реальных условиях

Scaling Up to Excellence: Practicing Model Scaling for Photo-Realistic Image Restoration In the Wild

January 24, 2024
Авторы: Fanghua Yu, Jinjin Gu, Zheyuan Li, Jinfan Hu, Xiangtao Kong, Xintao Wang, Jingwen He, Yu Qiao, Chao Dong
cs.AI

Аннотация

Мы представляем SUPIR (Scaling-UP Image Restoration) — революционный метод восстановления изображений, который использует генеративные априорные знания и мощь масштабирования моделей. Благодаря применению мультимодальных техник и передовых генеративных априорных знаний, SUPIR знаменует собой значительный прорыв в области интеллектуального и реалистичного восстановления изображений. Масштабирование моделей, выступающее ключевым катализатором в SUPIR, существенно расширяет его возможности и открывает новые перспективы для восстановления изображений. Мы собрали набор данных, включающий 20 миллионов высококачественных изображений высокого разрешения для обучения модели, каждое из которых дополнено текстовыми аннотациями. SUPIR предоставляет возможность восстанавливать изображения с учетом текстовых подсказок, что расширяет область его применения и потенциал. Кроме того, мы вводим подсказки с отрицательным качеством для дальнейшего улучшения воспринимаемого качества. Также мы разработали метод сэмплирования, управляемого восстановлением, чтобы подавить проблемы с точностью, возникающие при генеративном восстановлении. Эксперименты демонстрируют исключительные результаты восстановления SUPIR и его новую способность управлять процессом восстановления через текстовые подсказки.
English
We introduce SUPIR (Scaling-UP Image Restoration), a groundbreaking image restoration method that harnesses generative prior and the power of model scaling up. Leveraging multi-modal techniques and advanced generative prior, SUPIR marks a significant advance in intelligent and realistic image restoration. As a pivotal catalyst within SUPIR, model scaling dramatically enhances its capabilities and demonstrates new potential for image restoration. We collect a dataset comprising 20 million high-resolution, high-quality images for model training, each enriched with descriptive text annotations. SUPIR provides the capability to restore images guided by textual prompts, broadening its application scope and potential. Moreover, we introduce negative-quality prompts to further improve perceptual quality. We also develop a restoration-guided sampling method to suppress the fidelity issue encountered in generative-based restoration. Experiments demonstrate SUPIR's exceptional restoration effects and its novel capacity to manipulate restoration through textual prompts.
PDF7515December 15, 2024