Poda de Redes Multi-Tarefa Superparametrizadas para Restauração de Imagens Web Degradadas
Pruning Overparameterized Multi-Task Networks for Degraded Web Image Restoration
October 16, 2025
Autores: Thomas Katraouras, Dimitrios Rafailidis
cs.AI
Resumo
A qualidade da imagem é um fator crítico para a entrega de conteúdo visualmente atraente em plataformas web. No entanto, as imagens frequentemente sofrem degradação devido a operações com perdas aplicadas por redes sociais online (OSNs), impactando negativamente a experiência do usuário. A restauração de imagens é o processo de recuperar uma imagem limpa e de alta qualidade a partir de uma entrada degradada. Recentemente, modelos de restauração de imagens multitarefa (tudo-em-um) ganharam atenção significativa, devido à sua capacidade de lidar simultaneamente com diferentes tipos de degradações de imagem. No entanto, esses modelos geralmente possuem um número excessivamente alto de parâmetros treináveis, tornando-os computacionalmente ineficientes. Neste artigo, propomos uma estratégia para comprimir modelos de restauração de imagens multitarefa. Nosso objetivo é descobrir sub-redes altamente esparsas dentro de modelos profundos superparametrizados que possam igualar ou até superar o desempenho de suas contrapartes densas. O modelo proposto, denominado MIR-L, utiliza uma estratégia de poda iterativa que remove pesos de baixa magnitude em várias rodadas, enquanto redefine os pesos restantes para sua inicialização original. Esse processo iterativo é importante para a otimização do modelo de restauração de imagens multitarefa, revelando efetivamente "bilhetes vencedores" que mantêm ou superam o desempenho de ponta em níveis altos de esparsidade. A avaliação experimental em conjuntos de dados de referência para tarefas de remoção de chuva, desembaçamento e redução de ruído mostra que o MIR-L retém apenas 10% dos parâmetros treináveis, mantendo um alto desempenho na restauração de imagens. Nosso código, conjuntos de dados e modelos pré-treinados estão disponíveis publicamente em https://github.com/Thomkat/MIR-L.
English
Image quality is a critical factor in delivering visually appealing content
on web platforms. However, images often suffer from degradation due to lossy
operations applied by online social networks (OSNs), negatively affecting user
experience. Image restoration is the process of recovering a clean high-quality
image from a given degraded input. Recently, multi-task (all-in-one) image
restoration models have gained significant attention, due to their ability to
simultaneously handle different types of image degradations. However, these
models often come with an excessively high number of trainable parameters,
making them computationally inefficient. In this paper, we propose a strategy
for compressing multi-task image restoration models. We aim to discover highly
sparse subnetworks within overparameterized deep models that can match or even
surpass the performance of their dense counterparts. The proposed model, namely
MIR-L, utilizes an iterative pruning strategy that removes low-magnitude
weights across multiple rounds, while resetting the remaining weights to their
original initialization. This iterative process is important for the multi-task
image restoration model's optimization, effectively uncovering "winning
tickets" that maintain or exceed state-of-the-art performance at high sparsity
levels. Experimental evaluation on benchmark datasets for the deraining,
dehazing, and denoising tasks shows that MIR-L retains only 10% of the
trainable parameters while maintaining high image restoration performance. Our
code, datasets and pre-trained models are made publicly available at
https://github.com/Thomkat/MIR-L.