ChatPaper.aiChatPaper

Escalando para a Excelência: Praticando o Dimensionamento de Modelos para Restauração Foto-Realista de Imagens em Ambientes Reais

Scaling Up to Excellence: Practicing Model Scaling for Photo-Realistic Image Restoration In the Wild

January 24, 2024
Autores: Fanghua Yu, Jinjin Gu, Zheyuan Li, Jinfan Hu, Xiangtao Kong, Xintao Wang, Jingwen He, Yu Qiao, Chao Dong
cs.AI

Resumo

Apresentamos o SUPIR (Scaling-UP Image Restoration), um método inovador de restauração de imagens que utiliza prior generativo e o poder de escalonamento de modelos. Aproveitando técnicas multimodais e prior generativo avançado, o SUPIR representa um avanço significativo na restauração de imagens inteligente e realista. Como um catalisador fundamental dentro do SUPIR, o escalonamento de modelos amplia drasticamente suas capacidades e demonstra um novo potencial para a restauração de imagens. Coletamos um conjunto de dados composto por 20 milhões de imagens de alta resolução e qualidade para o treinamento do modelo, cada uma enriquecida com anotações textuais descritivas. O SUPIR oferece a capacidade de restaurar imagens guiadas por prompts textuais, ampliando seu escopo de aplicação e potencial. Além disso, introduzimos prompts de qualidade negativa para melhorar ainda mais a qualidade perceptiva. Também desenvolvemos um método de amostragem guiada por restauração para suprimir o problema de fidelidade encontrado na restauração baseada em geração. Experimentos demonstram os efeitos excepcionais de restauração do SUPIR e sua nova capacidade de manipular a restauração por meio de prompts textuais.
English
We introduce SUPIR (Scaling-UP Image Restoration), a groundbreaking image restoration method that harnesses generative prior and the power of model scaling up. Leveraging multi-modal techniques and advanced generative prior, SUPIR marks a significant advance in intelligent and realistic image restoration. As a pivotal catalyst within SUPIR, model scaling dramatically enhances its capabilities and demonstrates new potential for image restoration. We collect a dataset comprising 20 million high-resolution, high-quality images for model training, each enriched with descriptive text annotations. SUPIR provides the capability to restore images guided by textual prompts, broadening its application scope and potential. Moreover, we introduce negative-quality prompts to further improve perceptual quality. We also develop a restoration-guided sampling method to suppress the fidelity issue encountered in generative-based restoration. Experiments demonstrate SUPIR's exceptional restoration effects and its novel capacity to manipulate restoration through textual prompts.
PDF7716December 15, 2024