ChatPaper.aiChatPaper

Poda de Redes Multitarea Sobredimensionadas para la Restauración de Imágenes Web Degradadas

Pruning Overparameterized Multi-Task Networks for Degraded Web Image Restoration

October 16, 2025
Autores: Thomas Katraouras, Dimitrios Rafailidis
cs.AI

Resumen

La calidad de la imagen es un factor crítico para ofrecer contenido visualmente atractivo en plataformas web. Sin embargo, las imágenes a menudo sufren degradación debido a operaciones con pérdida aplicadas por las redes sociales en línea (OSNs, por sus siglas en inglés), lo que afecta negativamente la experiencia del usuario. La restauración de imágenes es el proceso de recuperar una imagen limpia y de alta calidad a partir de una entrada degradada. Recientemente, los modelos de restauración de imágenes multitarea (todo en uno) han ganado una atención significativa debido a su capacidad para manejar simultáneamente diferentes tipos de degradación de imágenes. Sin embargo, estos modelos suelen tener un número excesivamente alto de parámetros entrenables, lo que los hace computacionalmente ineficientes. En este artículo, proponemos una estrategia para comprimir modelos de restauración de imágenes multitarea. Nuestro objetivo es descubrir subredes altamente dispersas dentro de modelos profundos sobreparametrizados que puedan igualar o incluso superar el rendimiento de sus contrapartes densas. El modelo propuesto, denominado MIR-L, utiliza una estrategia de poda iterativa que elimina los pesos de baja magnitud en múltiples rondas, mientras restablece los pesos restantes a su inicialización original. Este proceso iterativo es importante para la optimización del modelo de restauración de imágenes multitarea, descubriendo efectivamente "boletos ganadores" que mantienen o superan el rendimiento de vanguardia en niveles altos de dispersión. La evaluación experimental en conjuntos de datos de referencia para las tareas de eliminación de lluvia, desenfoque y reducción de ruido muestra que MIR-L retiene solo el 10% de los parámetros entrenables mientras mantiene un alto rendimiento en la restauración de imágenes. Nuestro código, conjuntos de datos y modelos preentrenados están disponibles públicamente en https://github.com/Thomkat/MIR-L.
English
Image quality is a critical factor in delivering visually appealing content on web platforms. However, images often suffer from degradation due to lossy operations applied by online social networks (OSNs), negatively affecting user experience. Image restoration is the process of recovering a clean high-quality image from a given degraded input. Recently, multi-task (all-in-one) image restoration models have gained significant attention, due to their ability to simultaneously handle different types of image degradations. However, these models often come with an excessively high number of trainable parameters, making them computationally inefficient. In this paper, we propose a strategy for compressing multi-task image restoration models. We aim to discover highly sparse subnetworks within overparameterized deep models that can match or even surpass the performance of their dense counterparts. The proposed model, namely MIR-L, utilizes an iterative pruning strategy that removes low-magnitude weights across multiple rounds, while resetting the remaining weights to their original initialization. This iterative process is important for the multi-task image restoration model's optimization, effectively uncovering "winning tickets" that maintain or exceed state-of-the-art performance at high sparsity levels. Experimental evaluation on benchmark datasets for the deraining, dehazing, and denoising tasks shows that MIR-L retains only 10% of the trainable parameters while maintaining high image restoration performance. Our code, datasets and pre-trained models are made publicly available at https://github.com/Thomkat/MIR-L.
PDF22October 22, 2025