MSRNet: Uma Rede Recursiva Multi-Escala para Detecção de Objetos Camuflados
MSRNet: A Multi-Scale Recursive Network for Camouflaged Object Detection
November 16, 2025
Autores: Leena Alghamdi, Muhammad Usman, Hafeez Anwar, Abdul Bais, Saeed Anwar
cs.AI
Resumo
A detecção de objetos camuflados é uma tarefa emergente e desafiadora na área de visão computacional, que requer a identificação e segmentação de objetos que se fundem perfeitamente aos seus ambientes devido à alta similaridade em cor, textura e tamanho. Esta tarefa é ainda mais complexificada por condições de baixa luminosidade, oclusão parcial, tamanho reduzido do objeto, padrões intrincados de fundo e presença de múltiplos objetos. Embora muitos métodos sofisticados tenham sido propostos para esta tarefa, as abordagens atuais ainda lutam para detectar com precisão objetos camuflados em cenários complexos, especialmente com objetos pequenos e múltiplos, indicando espaço para melhorias. Propomos uma Rede Recursiva Multi-Escala que extrai características multi-escala através de um *backbone* Pyramid Vision Transformer e as combina por meio de Unidades de Integração de Escala Baseadas em Atenção especializadas, permitindo a fusão seletiva de características. Para uma detecção de objetos mais precisa, nosso decodificador refina recursivamente as características incorporando Unidades de Fusão Multi-Granularidade. Uma nova estratégia de decodificação recursiva com *feedback* é desenvolvida para aprimorar a compreensão do contexto global, auxiliando o modelo a superar os desafios desta tarefa. Ao alavancar conjuntamente o aprendizado multi-escala e a otimização recursiva de características, nosso método proposto alcança ganhos de desempenho, detectando com sucesso objetos camuflados pequenos e múltiplos. Nosso modelo alcança resultados de última geração em dois conjuntos de dados de referência para detecção de objetos camuflados e classifica-se em segundo lugar nos dois restantes. Nossos códigos, pesos do modelo e resultados estão disponíveis em https://github.com/linaagh98/MSRNet.
English
Camouflaged object detection is an emerging and challenging computer vision task that requires identifying and segmenting objects that blend seamlessly into their environments due to high similarity in color, texture, and size. This task is further complicated by low-light conditions, partial occlusion, small object size, intricate background patterns, and multiple objects. While many sophisticated methods have been proposed for this task, current methods still struggle to precisely detect camouflaged objects in complex scenarios, especially with small and multiple objects, indicating room for improvement. We propose a Multi-Scale Recursive Network that extracts multi-scale features via a Pyramid Vision Transformer backbone and combines them via specialized Attention-Based Scale Integration Units, enabling selective feature merging. For more precise object detection, our decoder recursively refines features by incorporating Multi-Granularity Fusion Units. A novel recursive-feedback decoding strategy is developed to enhance global context understanding, helping the model overcome the challenges in this task. By jointly leveraging multi-scale learning and recursive feature optimization, our proposed method achieves performance gains, successfully detecting small and multiple camouflaged objects. Our model achieves state-of-the-art results on two benchmark datasets for camouflaged object detection and ranks second on the remaining two. Our codes, model weights, and results are available at https://github.com/linaagh98/MSRNet{https://github.com/linaagh98/MSRNet}.