MSRNet : Un réseau récursif multi-échelle pour la détection d'objets camouflés
MSRNet: A Multi-Scale Recursive Network for Camouflaged Object Detection
November 16, 2025
papers.authors: Leena Alghamdi, Muhammad Usman, Hafeez Anwar, Abdul Bais, Saeed Anwar
cs.AI
papers.abstract
La détection d'objets camouflés est une tâche émergente et complexe en vision par ordinateur qui consiste à identifier et à segmenter des objets se fondant parfaitement dans leur environnement en raison d'une similarité élevée de couleur, de texture et de taille. Cette tâche est encore compliquée par des conditions de faible luminosité, des occultations partielles, la petite taille des objets, des motifs d'arrière-plan complexes et la présence de multiples objets. Bien que de nombreuses méthodes sophistiquées aient été proposées pour cette tâche, les approches actuelles peinent encore à détecter avec précision les objets camouflés dans des scénarios complexes, particulièrement pour les petits et multiples objets, ce qui indique une marge d'amélioration. Nous proposons un Réseau Récurrent Multi-Échelle qui extrait des caractéristiques multi-échelles via un réseau dorsal de type Pyramid Vision Transformer et les combine via des Unités d'Intégration d'Échelle par Attention spécialisées, permettant une fusion sélective des caractéristiques. Pour une détection d'objets plus précise, notre décodeur affine récursivement les caractéristiques en incorporant des Unités de Fusion Multi-Granularité. Une nouvelle stratégie de décodage par rétroaction récursive est développée pour améliorer la compréhension du contexte global, aidant le modèle à surmonter les défis de cette tâche. En tirant parti conjointement de l'apprentissage multi-échelle et de l'optimisation récursive des caractéristiques, notre méthode proposée obtient des gains de performance, détectant avec succès les petits et multiples objets camouflés. Notre modèle atteint des résultats state-of-the-art sur deux ensembles de données de référence pour la détection d'objets camouflés et se classe deuxième sur les deux autres. Nos codes, poids de modèle et résultats sont disponibles à l'adresse https://github.com/linaagh98/MSRNet.
English
Camouflaged object detection is an emerging and challenging computer vision task that requires identifying and segmenting objects that blend seamlessly into their environments due to high similarity in color, texture, and size. This task is further complicated by low-light conditions, partial occlusion, small object size, intricate background patterns, and multiple objects. While many sophisticated methods have been proposed for this task, current methods still struggle to precisely detect camouflaged objects in complex scenarios, especially with small and multiple objects, indicating room for improvement. We propose a Multi-Scale Recursive Network that extracts multi-scale features via a Pyramid Vision Transformer backbone and combines them via specialized Attention-Based Scale Integration Units, enabling selective feature merging. For more precise object detection, our decoder recursively refines features by incorporating Multi-Granularity Fusion Units. A novel recursive-feedback decoding strategy is developed to enhance global context understanding, helping the model overcome the challenges in this task. By jointly leveraging multi-scale learning and recursive feature optimization, our proposed method achieves performance gains, successfully detecting small and multiple camouflaged objects. Our model achieves state-of-the-art results on two benchmark datasets for camouflaged object detection and ranks second on the remaining two. Our codes, model weights, and results are available at https://github.com/linaagh98/MSRNet{https://github.com/linaagh98/MSRNet}.