Poda de Redes Multitarea Sobredimensionadas para la Restauración de Imágenes Web Degradadas
Pruning Overparameterized Multi-Task Networks for Degraded Web Image Restoration
October 16, 2025
Autores: Thomas Katraouras, Dimitrios Rafailidis
cs.AI
Resumen
La calidad de la imagen es un factor crítico para ofrecer contenido visualmente atractivo en plataformas web. Sin embargo, las imágenes a menudo sufren degradación debido a operaciones con pérdida aplicadas por las redes sociales en línea (OSNs, por sus siglas en inglés), lo que afecta negativamente la experiencia del usuario. La restauración de imágenes es el proceso de recuperar una imagen limpia y de alta calidad a partir de una entrada degradada. Recientemente, los modelos de restauración de imágenes multitarea (todo en uno) han ganado una atención significativa debido a su capacidad para manejar simultáneamente diferentes tipos de degradación de imágenes. Sin embargo, estos modelos suelen tener un número excesivamente alto de parámetros entrenables, lo que los hace computacionalmente ineficientes. En este artículo, proponemos una estrategia para comprimir modelos de restauración de imágenes multitarea. Nuestro objetivo es descubrir subredes altamente dispersas dentro de modelos profundos sobreparametrizados que puedan igualar o incluso superar el rendimiento de sus contrapartes densas. El modelo propuesto, denominado MIR-L, utiliza una estrategia de poda iterativa que elimina los pesos de baja magnitud en múltiples rondas, mientras restablece los pesos restantes a su inicialización original. Este proceso iterativo es importante para la optimización del modelo de restauración de imágenes multitarea, descubriendo efectivamente "boletos ganadores" que mantienen o superan el rendimiento de vanguardia en niveles altos de dispersión. La evaluación experimental en conjuntos de datos de referencia para las tareas de eliminación de lluvia, desenfoque y reducción de ruido muestra que MIR-L retiene solo el 10% de los parámetros entrenables mientras mantiene un alto rendimiento en la restauración de imágenes. Nuestro código, conjuntos de datos y modelos preentrenados están disponibles públicamente en https://github.com/Thomkat/MIR-L.
English
Image quality is a critical factor in delivering visually appealing content
on web platforms. However, images often suffer from degradation due to lossy
operations applied by online social networks (OSNs), negatively affecting user
experience. Image restoration is the process of recovering a clean high-quality
image from a given degraded input. Recently, multi-task (all-in-one) image
restoration models have gained significant attention, due to their ability to
simultaneously handle different types of image degradations. However, these
models often come with an excessively high number of trainable parameters,
making them computationally inefficient. In this paper, we propose a strategy
for compressing multi-task image restoration models. We aim to discover highly
sparse subnetworks within overparameterized deep models that can match or even
surpass the performance of their dense counterparts. The proposed model, namely
MIR-L, utilizes an iterative pruning strategy that removes low-magnitude
weights across multiple rounds, while resetting the remaining weights to their
original initialization. This iterative process is important for the multi-task
image restoration model's optimization, effectively uncovering "winning
tickets" that maintain or exceed state-of-the-art performance at high sparsity
levels. Experimental evaluation on benchmark datasets for the deraining,
dehazing, and denoising tasks shows that MIR-L retains only 10% of the
trainable parameters while maintaining high image restoration performance. Our
code, datasets and pre-trained models are made publicly available at
https://github.com/Thomkat/MIR-L.