AFRDA: Refinamento de Características Atentivas para Segmentação Semântica com Adaptação de Domínio

Resumo

Na Segmentação Semântica Adaptativa de Domínio Não Supervisionado (UDA-SS), um modelo é treinado com dados rotulados de um domínio de origem (por exemplo, imagens sintéticas) e adaptado a um domínio de destino não rotulado (por exemplo, imagens do mundo real) sem acesso às anotações do domínio de destino. Os métodos existentes de UDA-SS frequentemente enfrentam dificuldades para equilibrar detalhes locais refinados com informações contextuais globais, resultando em erros de segmentação em regiões complexas. Para resolver isso, introduzimos o módulo de Refinamento Adaptativo de Características (AFR), que melhora a precisão da segmentação refinando características de alta resolução usando prioridades semânticas de logits de baixa resolução. O AFR também integra componentes de alta frequência, que capturam estruturas refinadas e fornecem informações cruciais sobre os limites, melhorando a delimitação de objetos. Além disso, o AFR equilibra adaptativamente informações locais e globais por meio de atenção guiada por incerteza, reduzindo classificações incorretas. Seu design leve permite uma integração perfeita em métodos UDA baseados em HRDA, levando a um desempenho de segmentação de última geração. Nossa abordagem melhora os métodos existentes de UDA-SS em 1,05% mIoU em GTA V --> Cityscapes e 1,04% mIoU em Synthia --> Cityscapes. A implementação do nosso framework está disponível em: https://github.com/Masrur02/AFRDA.

English

In Unsupervised Domain Adaptive Semantic Segmentation (UDA-SS), a model is trained on labeled source domain data (e.g., synthetic images) and adapted to an unlabeled target domain (e.g., real-world images) without access to target annotations. Existing UDA-SS methods often struggle to balance fine-grained local details with global contextual information, leading to segmentation errors in complex regions. To address this, we introduce the Adaptive Feature Refinement (AFR) module, which enhances segmentation accuracy by refining highresolution features using semantic priors from low-resolution logits. AFR also integrates high-frequency components, which capture fine-grained structures and provide crucial boundary information, improving object delineation. Additionally, AFR adaptively balances local and global information through uncertaintydriven attention, reducing misclassifications. Its lightweight design allows seamless integration into HRDA-based UDA methods, leading to state-of-the-art segmentation performance. Our approach improves existing UDA-SS methods by 1.05% mIoU on GTA V --> Cityscapes and 1.04% mIoU on Synthia-->Cityscapes. The implementation of our framework is available at: https://github.com/Masrur02/AFRDA

AFRDA: Refinamento de Características Atentivas para Segmentação Semântica com Adaptação de Domínio

AFRDA: Attentive Feature Refinement for Domain Adaptive Semantic Segmentation

Resumo

Support