過剰パラメータ化されたマルチタスクネットワークの剪定による劣化ウェブ画像の復元
Pruning Overparameterized Multi-Task Networks for Degraded Web Image Restoration
October 16, 2025
著者: Thomas Katraouras, Dimitrios Rafailidis
cs.AI
要旨
画像品質は、ウェブプラットフォーム上で視覚的に魅力的なコンテンツを提供する上で重要な要素である。しかし、オンラインソーシャルネットワーク(OSNs)によって適用される非可逆操作により、画像はしばしば劣化し、ユーザー体験に悪影響を及ぼす。画像復元とは、与えられた劣化した入力から高品質なクリーンな画像を回復するプロセスである。近年、複数のタスク(オールインワン)を同時に処理できる画像復元モデルが注目を集めている。しかし、これらのモデルはしばしば過剰な数の学習可能なパラメータを有しており、計算効率が低い。本論文では、複数タスク画像復元モデルを圧縮する戦略を提案する。過剰パラメータ化された深層モデル内で、密なモデルの性能に匹敵し、あるいはそれを上回る高度に疎なサブネットワークを発見することを目指す。提案モデルであるMIR-Lは、複数ラウンドにわたって低い大きさの重みを除去し、残りの重みを元の初期化値にリセットする反復的プルーニング戦略を採用する。この反復プロセスは、複数タスク画像復元モデルの最適化において重要であり、高い疎性レベルにおいても最先端の性能を維持または向上させる「ウィニングチケット」を効果的に発見する。脱雨、脱霧、およびノイズ除去タスクのベンチマークデータセットでの実験的評価により、MIR-Lは学習可能なパラメータの10%のみを保持しながらも、高い画像復元性能を維持することが示された。我々のコード、データセット、および事前学習済みモデルは、https://github.com/Thomkat/MIR-L で公開されている。
English
Image quality is a critical factor in delivering visually appealing content
on web platforms. However, images often suffer from degradation due to lossy
operations applied by online social networks (OSNs), negatively affecting user
experience. Image restoration is the process of recovering a clean high-quality
image from a given degraded input. Recently, multi-task (all-in-one) image
restoration models have gained significant attention, due to their ability to
simultaneously handle different types of image degradations. However, these
models often come with an excessively high number of trainable parameters,
making them computationally inefficient. In this paper, we propose a strategy
for compressing multi-task image restoration models. We aim to discover highly
sparse subnetworks within overparameterized deep models that can match or even
surpass the performance of their dense counterparts. The proposed model, namely
MIR-L, utilizes an iterative pruning strategy that removes low-magnitude
weights across multiple rounds, while resetting the remaining weights to their
original initialization. This iterative process is important for the multi-task
image restoration model's optimization, effectively uncovering "winning
tickets" that maintain or exceed state-of-the-art performance at high sparsity
levels. Experimental evaluation on benchmark datasets for the deraining,
dehazing, and denoising tasks shows that MIR-L retains only 10% of the
trainable parameters while maintaining high image restoration performance. Our
code, datasets and pre-trained models are made publicly available at
https://github.com/Thomkat/MIR-L.