RealRestorer:大規模画像編集モデルによる一般化可能な実世界画像修復へのアプローチ
RealRestorer: Towards Generalizable Real-World Image Restoration with Large-Scale Image Editing Models
March 26, 2026
著者: Yufeng Yang, Xianfang Zeng, Zhangqi Jiang, Fukun Yin, Jianzhuang Liu, Wei Cheng, jinghong lan, Shiyu Liu, Yuqi Peng, Gang YU, Shifeng Chen
cs.AI
要旨
実世界における画像劣化に対する画像復元技術は、自動運転や物体検出などの下流タスクにおいて極めて重要である。しかし、既存の復元モデルは学習データの規模と分布に制限され、実世界シナリオへの汎化性能が不十分な場合が多い。近年、大規模画像編集モデルは復元タスクにおいて強力な汎化能力を示しており、特にNano Banana Proのようなクローズドソースモデルは一貫性を保ちながら画像を復元できる。とはいえ、このような大規模汎用モデルで同等の性能を達成するには、膨大なデータと計算コストが必要となる。この課題を解決するため、我々は9種類の一般的な実世界劣化タイプを網羅する大規模データセットを構築し、クローズドソースモデルとの性能差を縮める最先端のオープンソースモデルを学習した。さらに、464枚の実世界劣化画像と、劣化除去と一貫性保持に焦点を当てた評価指標を含むRealIR-Benchを導入する。大規模な実験により、本モデルがオープンソース手法の中で首位を獲得し、最先端の性能を達成することを実証した。
English
Image restoration under real-world degradations is critical for downstream tasks such as autonomous driving and object detection. However, existing restoration models are often limited by the scale and distribution of their training data, resulting in poor generalization to real-world scenarios. Recently, large-scale image editing models have shown strong generalization ability in restoration tasks, especially for closed-source models like Nano Banana Pro, which can restore images while preserving consistency. Nevertheless, achieving such performance with those large universal models requires substantial data and computational costs. To address this issue, we construct a large-scale dataset covering nine common real-world degradation types and train a state-of-the-art open-source model to narrow the gap with closed-source alternatives. Furthermore, we introduce RealIR-Bench, which contains 464 real-world degraded images and tailored evaluation metrics focusing on degradation removal and consistency preservation. Extensive experiments demonstrate our model ranks first among open-source methods, achieving state-of-the-art performance.