MSRNet: Een Multi-Schaal Recursief Netwerk voor de Detectie van Gecamoufleerde Objecten
MSRNet: A Multi-Scale Recursive Network for Camouflaged Object Detection
November 16, 2025
Auteurs: Leena Alghamdi, Muhammad Usman, Hafeez Anwar, Abdul Bais, Saeed Anwar
cs.AI
Samenvatting
Camouflage-objectdetectie is een opkomende en uitdagende computervisietaak die het identificeren en segmenteren vereist van objecten die naadloos opgaan in hun omgeving door hoge gelijkenis in kleur, textuur en grootte. Deze taak wordt verder bemoeilijkt door omstandigheden met weinig licht, gedeeltelijke occlusie, kleine objectgrootte, ingewikkelde achtergrondpatronen en meerdere objecten. Hoewel er veel geavanceerde methoden voor deze taak zijn voorgesteld, worstelen huidige methoden nog steeds met het nauwkeurig detecteren van gecamoufleerde objecten in complexe scenario's, vooral bij kleine en meerdere objecten, wat wijst op ruimte voor verbetering. Wij stellen een Multi-Schaal Recursief Netwerk voor dat multi-schaalkenmerken extraheert via een Pyramid Vision Transformer-backbone en deze combineert via gespecialiseerde Attention-Based Scale Integration Units, waardoor selectieve kenmerksamenvoging mogelijk wordt. Voor nauwkeurigere objectdetectie verfijnt onze decoder kenmerken recursief door Multi-Granularity Fusion Units te integreren. Een nieuwe recursief-feedback-decoderingsstrategie is ontwikkeld om het globaal contextbegrip te verbeteren, wat het model helpt de uitdagingen in deze taak te overwinnen. Door multi-schaaller en recursieve kenmerkoptimalisatie gezamenlijk te benutten, behaalt onze voorgestelde methode prestatieverbeteringen en detecteert zij succesvol kleine en meerdere gecamoufleerde objecten. Ons model behaalt state-of-the-art resultaten op twee benchmarkdatasets voor camouflage-objectdetectie en staat op de tweede plaats op de overige twee. Onze codes, modelgewichten en resultaten zijn beschikbaar op https://github.com/linaagh98/MSRNet.
English
Camouflaged object detection is an emerging and challenging computer vision task that requires identifying and segmenting objects that blend seamlessly into their environments due to high similarity in color, texture, and size. This task is further complicated by low-light conditions, partial occlusion, small object size, intricate background patterns, and multiple objects. While many sophisticated methods have been proposed for this task, current methods still struggle to precisely detect camouflaged objects in complex scenarios, especially with small and multiple objects, indicating room for improvement. We propose a Multi-Scale Recursive Network that extracts multi-scale features via a Pyramid Vision Transformer backbone and combines them via specialized Attention-Based Scale Integration Units, enabling selective feature merging. For more precise object detection, our decoder recursively refines features by incorporating Multi-Granularity Fusion Units. A novel recursive-feedback decoding strategy is developed to enhance global context understanding, helping the model overcome the challenges in this task. By jointly leveraging multi-scale learning and recursive feature optimization, our proposed method achieves performance gains, successfully detecting small and multiple camouflaged objects. Our model achieves state-of-the-art results on two benchmark datasets for camouflaged object detection and ranks second on the remaining two. Our codes, model weights, and results are available at https://github.com/linaagh98/MSRNet{https://github.com/linaagh98/MSRNet}.