ChatPaper.aiChatPaper

Opschalen naar perfectie: Toepassen van modelschaling voor foto-realistisch beeldherstel in natuurlijke omgevingen

Scaling Up to Excellence: Practicing Model Scaling for Photo-Realistic Image Restoration In the Wild

January 24, 2024
Auteurs: Fanghua Yu, Jinjin Gu, Zheyuan Li, Jinfan Hu, Xiangtao Kong, Xintao Wang, Jingwen He, Yu Qiao, Chao Dong
cs.AI

Samenvatting

We introduceren SUPIR (Scaling-UP Image Restoration), een baanbrekende methode voor beeldherstel die gebruikmaakt van generatieve prior en de kracht van modelschaling. Door gebruik te maken van multimodale technieken en geavanceerde generatieve prior, markeert SUPIR een significante vooruitgang in intelligent en realistisch beeldherstel. Als een cruciale katalysator binnen SUPIR, verbetert modelschaling de mogelijkheden aanzienlijk en toont het nieuwe potentieel voor beeldherstel. We hebben een dataset verzameld bestaande uit 20 miljoen hoogwaardige, hoogresolutiebeelden voor modeltraining, elk verrijkt met beschrijvende tekstannotaties. SUPIR biedt de mogelijkheid om beelden te herstellen onder begeleiding van tekstuele prompts, waardoor het toepassingsbereik en potentieel worden verbreed. Bovendien introduceren we negatieve-kwaliteit prompts om de perceptuele kwaliteit verder te verbeteren. We ontwikkelen ook een herstelgeleide bemonsteringsmethode om het trouwheidsprobleem dat wordt aangetroffen bij generatief gebaseerd herstel te onderdrukken. Experimenten tonen de uitzonderlijke hersteleffecten van SUPIR en de nieuwe capaciteit om herstel te manipuleren via tekstuele prompts.
English
We introduce SUPIR (Scaling-UP Image Restoration), a groundbreaking image restoration method that harnesses generative prior and the power of model scaling up. Leveraging multi-modal techniques and advanced generative prior, SUPIR marks a significant advance in intelligent and realistic image restoration. As a pivotal catalyst within SUPIR, model scaling dramatically enhances its capabilities and demonstrates new potential for image restoration. We collect a dataset comprising 20 million high-resolution, high-quality images for model training, each enriched with descriptive text annotations. SUPIR provides the capability to restore images guided by textual prompts, broadening its application scope and potential. Moreover, we introduce negative-quality prompts to further improve perceptual quality. We also develop a restoration-guided sampling method to suppress the fidelity issue encountered in generative-based restoration. Experiments demonstrate SUPIR's exceptional restoration effects and its novel capacity to manipulate restoration through textual prompts.
PDF7716December 15, 2024