MSRNet: Una rete ricorsiva multi-scala per il rilevamento di oggetti mimetizzati
MSRNet: A Multi-Scale Recursive Network for Camouflaged Object Detection
November 16, 2025
Autori: Leena Alghamdi, Muhammad Usman, Hafeez Anwar, Abdul Bais, Saeed Anwar
cs.AI
Abstract
La rilevazione di oggetti mimetizzati è un compito emergente e impegnativo nel campo della visione artificiale, che richiede l'identificazione e la segmentazione di oggetti che si fondono perfettamente con il loro ambiente a causa dell'elevata somiglianza in termini di colore, texture e dimensioni. Questo compito è ulteriormente complicato da condizioni di scarsa illuminazione, occlusione parziale, dimensioni ridotte degli oggetti, pattern di sfondo intricati e presenza di oggetti multipli. Sebbene siano stati proposti molti metodi sofisticati per questo compito, gli approcci attuali faticano ancora a rilevare con precisione gli oggetti mimetizzati in scenari complessi, specialmente con oggetti piccoli e multipli, indicando margini di miglioramento. Proponiamo una Rete Ricorsiva Multi-Scala che estrae caratteristiche multi-scala attraverso un backbone Pyramid Vision Transformer e le combina tramite apposite Unità di Integrazione Scala Basate su Attenzione, consentendo una fusione selettiva delle caratteristiche. Per una rilevazione più precisa degli oggetti, il nostro decoder affina ricorsivamente le caratteristiche incorporando Unità di Fusione Multi-Granularità. È stata sviluppata una nuova strategia di decoding a feedback ricorsivo per migliorare la comprensione del contesto globale, aiutando il modello a superare le sfide di questo compito. Sfruttando congiuntamente l'apprendimento multi-scala e l'ottimizzazione ricorsiva delle caratteristiche, il nostro metodo proposto consegue miglioramenti prestazionali, rilevando con successo oggetti mimetizzati piccoli e multipli. Il nostro modello raggiunge risultati state-of-the-art su due dataset di benchmark per la rilevazione di oggetti mimetizzati e si classifica secondo sui restanti due. I nostri codici, i pesi del modello e i risultati sono disponibili su https://github.com/linaagh98/MSRNet.
English
Camouflaged object detection is an emerging and challenging computer vision task that requires identifying and segmenting objects that blend seamlessly into their environments due to high similarity in color, texture, and size. This task is further complicated by low-light conditions, partial occlusion, small object size, intricate background patterns, and multiple objects. While many sophisticated methods have been proposed for this task, current methods still struggle to precisely detect camouflaged objects in complex scenarios, especially with small and multiple objects, indicating room for improvement. We propose a Multi-Scale Recursive Network that extracts multi-scale features via a Pyramid Vision Transformer backbone and combines them via specialized Attention-Based Scale Integration Units, enabling selective feature merging. For more precise object detection, our decoder recursively refines features by incorporating Multi-Granularity Fusion Units. A novel recursive-feedback decoding strategy is developed to enhance global context understanding, helping the model overcome the challenges in this task. By jointly leveraging multi-scale learning and recursive feature optimization, our proposed method achieves performance gains, successfully detecting small and multiple camouflaged objects. Our model achieves state-of-the-art results on two benchmark datasets for camouflaged object detection and ranks second on the remaining two. Our codes, model weights, and results are available at https://github.com/linaagh98/MSRNet{https://github.com/linaagh98/MSRNet}.