ChatPaper.aiChatPaper

MSRNet: Ein mehrskaliges rekursives Netzwerk zur Erkennung von getarnten Objekten

MSRNet: A Multi-Scale Recursive Network for Camouflaged Object Detection

November 16, 2025
papers.authors: Leena Alghamdi, Muhammad Usman, Hafeez Anwar, Abdul Bais, Saeed Anwar
cs.AI

papers.abstract

Die Erkennung von getarnten Objekten ist eine aufstrebende und anspruchsvolle Aufgabe im Bereich Computer Vision, bei der Objekte identifiziert und segmentiert werden müssen, die sich aufgrund hoher Ähnlichkeit in Farbe, Textur und Größe nahtlos in ihre Umgebung einfügen. Diese Aufgabe wird durch schwierige Lichtverhältnisse, partielle Verdeckungen, geringe Objektgrößen, komplexe Hintergrundmuster und mehrere Objekte zusätzlich erschwert. Obwohl bereits viele ausgefeilte Methoden für diese Aufgabe vorgeschlagen wurden, haben bestehende Ansätze nach wie vor Schwierigkeiten, getarnte Objekte in komplexen Szenarien präzise zu erkennen – insbesondere bei kleinen und multiplen Objekten –, was auf Verbesserungspotenzial hindeutet. Wir schlagen ein Multi-Scale Recursive Network vor, das über ein Pyramid Vision Transformer-Backbone Merkmale auf mehreren Skalen extrahiert und diese über spezielle Attention-Based Scale Integration Units kombiniert, wodurch eine selektive Merkmalsfusion ermöglicht wird. Für eine präzisere Objekterkennung verfeinert unser Decoder die Merkmale rekursiv durch den Einsatz von Multi-Granularity Fusion Units. Eine neuartige rekursiv-rückgekoppelte Decodierungsstrategie wurde entwickelt, um das globale Kontextverständnis zu verbessern und das Modell bei der Bewältigung der Herausforderungen dieser Aufgabe zu unterstützen. Durch die gemeinsame Nutzung von Multi-Scale-Lernen und rekursiver Merkmalsoptimierung erzielt unsere Methode Leistungssteigerungen und erkennt erfolgreich kleine und multiple getarnte Objekte. Unser Modell erreicht state-of-the-art Ergebnisse auf zwei Benchmark-Datensätzen zur Erkennung getarnter Objekte und belegt auf den beiden verbleibenden Datensätzen den zweiten Platz. Unsere Codes, Modellgewichte und Ergebnisse sind unter https://github.com/linaagh98/MSRNet verfügbar.
English
Camouflaged object detection is an emerging and challenging computer vision task that requires identifying and segmenting objects that blend seamlessly into their environments due to high similarity in color, texture, and size. This task is further complicated by low-light conditions, partial occlusion, small object size, intricate background patterns, and multiple objects. While many sophisticated methods have been proposed for this task, current methods still struggle to precisely detect camouflaged objects in complex scenarios, especially with small and multiple objects, indicating room for improvement. We propose a Multi-Scale Recursive Network that extracts multi-scale features via a Pyramid Vision Transformer backbone and combines them via specialized Attention-Based Scale Integration Units, enabling selective feature merging. For more precise object detection, our decoder recursively refines features by incorporating Multi-Granularity Fusion Units. A novel recursive-feedback decoding strategy is developed to enhance global context understanding, helping the model overcome the challenges in this task. By jointly leveraging multi-scale learning and recursive feature optimization, our proposed method achieves performance gains, successfully detecting small and multiple camouflaged objects. Our model achieves state-of-the-art results on two benchmark datasets for camouflaged object detection and ranks second on the remaining two. Our codes, model weights, and results are available at https://github.com/linaagh98/MSRNet{https://github.com/linaagh98/MSRNet}.
PDF12February 7, 2026