MSRNet: 위장된 객체 탐지를 위한 다중 스케일 순환 네트워크
MSRNet: A Multi-Scale Recursive Network for Camouflaged Object Detection
November 16, 2025
저자: Leena Alghamdi, Muhammad Usman, Hafeez Anwar, Abdul Bais, Saeed Anwar
cs.AI
초록
위장 객체 탐지는 색상, 질감, 크기에서 높은 유사성으로 주변 환경에 완벽하게 녹아드는 객체를 식별하고 분할해야 하는 새롭고 도전적인 컴퓨터 비전 과제입니다. 이 과제는 저조도 조건, 부분적 폐색, 작은 객체 크기, 복잡한 배경 패턴, 다중 객체로 인해 더욱 어려워집니다. 이 작업을 위해 많은 정교한 방법들이 제안되었지만, 현재 방법들은 특히 작고 다중 객체가 있는 복잡한 시나리오에서 위장 객체를 정밀하게 탐지하는 데 여전히 어려움을 겪어 개선의 여지가 있음을 보여줍니다. 우리는 Pyramid Vision Transformer 백본을 통해 다중 스케일 특징을 추출하고 특화된 Attention-Based Scale Integration Units을 통해 이를 결합하여 선택적 특징 병합을 가능하게 하는 Multi-Scale Recursive Network를 제안합니다. 보다 정밀한 객체 탐지를 위해, 우리의 디코더는 Multi-Granularity Fusion Units을 통합하여 특징을 재귀적으로 정제합니다. 전역적 맥락 이해를 향상시켜 모델이 이 과제의 어려움을 극복하도록 돕는 새로운 재귀-피드백 디코딩 전략을 개발했습니다. 다중 스케일 학습과 재귀적 특징 최적화를 공동으로 활용함으로써, 우리가 제안하는 방법은 성능 향상을 이루며 작고 다중 위장 객체를 성공적으로 탐지합니다. 우리 모델은 위장 객체 탐지를 위한 두 벤치마크 데이터셋에서 최첨단 결과를 달성하고 나머지 두 데이터셋에서 2위를 기록했습니다. 우리의 코드, 모델 가중치 및 결과는 https://github.com/linaagh98/MSRNet에서 확인할 수 있습니다.
English
Camouflaged object detection is an emerging and challenging computer vision task that requires identifying and segmenting objects that blend seamlessly into their environments due to high similarity in color, texture, and size. This task is further complicated by low-light conditions, partial occlusion, small object size, intricate background patterns, and multiple objects. While many sophisticated methods have been proposed for this task, current methods still struggle to precisely detect camouflaged objects in complex scenarios, especially with small and multiple objects, indicating room for improvement. We propose a Multi-Scale Recursive Network that extracts multi-scale features via a Pyramid Vision Transformer backbone and combines them via specialized Attention-Based Scale Integration Units, enabling selective feature merging. For more precise object detection, our decoder recursively refines features by incorporating Multi-Granularity Fusion Units. A novel recursive-feedback decoding strategy is developed to enhance global context understanding, helping the model overcome the challenges in this task. By jointly leveraging multi-scale learning and recursive feature optimization, our proposed method achieves performance gains, successfully detecting small and multiple camouflaged objects. Our model achieves state-of-the-art results on two benchmark datasets for camouflaged object detection and ranks second on the remaining two. Our codes, model weights, and results are available at https://github.com/linaagh98/MSRNet{https://github.com/linaagh98/MSRNet}.