MSRNet: Una Red Recursiva Multiescala para la Detección de Objetos Camuflados
MSRNet: A Multi-Scale Recursive Network for Camouflaged Object Detection
November 16, 2025
Autores: Leena Alghamdi, Muhammad Usman, Hafeez Anwar, Abdul Bais, Saeed Anwar
cs.AI
Resumen
La detección de objetos camuflados es una tarea emergente y desafiante en visión por computadora que requiere identificar y segmentar objetos que se fusionan imperceptiblemente con su entorno debido a su alta similitud en color, textura y tamaño. Esta tarea se complica aún más por condiciones de poca luz, oclusión parcial, tamaño reducido de los objetos, patrones de fondo intrincados y la presencia de múltiples objetos. Si bien se han propuesto muchos métodos sofisticados para esta tarea, los enfoques actuales aún tienen dificultades para detectar con precisión objetos camuflados en escenarios complejos, especialmente con objetos pequeños y múltiples, lo que indica margen de mejora. Proponemos una Red Recursiva Multi-Escala que extrae características multi-escala mediante un backbone de Pyramid Vision Transformer y las combina mediante Unidades de Integración de Escala Basadas en Atención especializadas, permitiendo una fusión selectiva de características. Para una detección de objetos más precisa, nuestro decodificador refina recursivamente las características incorporando Unidades de Fusión Multi-Granularidad. Se desarrolla una novedosa estrategia de decodificación de retroalimentación recursiva para mejorar la comprensión del contexto global, ayudando al modelo a superar los desafíos de esta tarea. Al aprovechar conjuntamente el aprendizaje multi-escala y la optimización recursiva de características, nuestro método propuesto logra mejoras de rendimiento, detectando exitosamente objetos camuflados pequeños y múltiples. Nuestro modelo alcanza resultados state-of-the-art en dos conjuntos de datos de referencia para detección de objetos camuflados y ocupa el segundo puesto en los dos restantes. Nuestros códigos, pesos del modelo y resultados están disponibles en https://github.com/linaagh98/MSRNet.
English
Camouflaged object detection is an emerging and challenging computer vision task that requires identifying and segmenting objects that blend seamlessly into their environments due to high similarity in color, texture, and size. This task is further complicated by low-light conditions, partial occlusion, small object size, intricate background patterns, and multiple objects. While many sophisticated methods have been proposed for this task, current methods still struggle to precisely detect camouflaged objects in complex scenarios, especially with small and multiple objects, indicating room for improvement. We propose a Multi-Scale Recursive Network that extracts multi-scale features via a Pyramid Vision Transformer backbone and combines them via specialized Attention-Based Scale Integration Units, enabling selective feature merging. For more precise object detection, our decoder recursively refines features by incorporating Multi-Granularity Fusion Units. A novel recursive-feedback decoding strategy is developed to enhance global context understanding, helping the model overcome the challenges in this task. By jointly leveraging multi-scale learning and recursive feature optimization, our proposed method achieves performance gains, successfully detecting small and multiple camouflaged objects. Our model achieves state-of-the-art results on two benchmark datasets for camouflaged object detection and ranks second on the remaining two. Our codes, model weights, and results are available at https://github.com/linaagh98/MSRNet{https://github.com/linaagh98/MSRNet}.