AFRDA: Внимательное уточнение признаков для адаптивной семантической сегментации доменов

Аннотация

В задаче семантической сегментации с адаптацией к домену без учителя (UDA-SS) модель обучается на размеченных данных исходного домена (например, синтетических изображениях) и адаптируется к неразмеченному целевому домену (например, реальным изображениям) без доступа к аннотациям целевого домена. Существующие методы UDA-SS часто сталкиваются с трудностями в балансировке мелкозернистых локальных деталей и глобальной контекстной информации, что приводит к ошибкам сегментации в сложных областях. Для решения этой проблемы мы представляем модуль Adaptive Feature Refinement (AFR), который повышает точность сегментации, уточняя высокоразрешающие признаки с использованием семантических априорных данных из низкоразрешающих логитов. AFR также интегрирует высокочастотные компоненты, которые захватывают мелкозернистые структуры и предоставляют важную информацию о границах, улучшая выделение объектов. Кроме того, AFR адаптивно балансирует локальную и глобальную информацию с помощью внимания, управляемого неопределенностью, что снижает количество ошибок классификации. Его легковесный дизайн позволяет легко интегрировать его в методы UDA, основанные на HRDA, что приводит к передовым результатам в сегментации. Наш подход улучшает существующие методы UDA-SS на 1.05% mIoU для GTA V --> Cityscapes и на 1.04% mIoU для Synthia-->Cityscapes. Реализация нашей платформы доступна по адресу: https://github.com/Masrur02/AFRDA.

English

In Unsupervised Domain Adaptive Semantic Segmentation (UDA-SS), a model is trained on labeled source domain data (e.g., synthetic images) and adapted to an unlabeled target domain (e.g., real-world images) without access to target annotations. Existing UDA-SS methods often struggle to balance fine-grained local details with global contextual information, leading to segmentation errors in complex regions. To address this, we introduce the Adaptive Feature Refinement (AFR) module, which enhances segmentation accuracy by refining highresolution features using semantic priors from low-resolution logits. AFR also integrates high-frequency components, which capture fine-grained structures and provide crucial boundary information, improving object delineation. Additionally, AFR adaptively balances local and global information through uncertaintydriven attention, reducing misclassifications. Its lightweight design allows seamless integration into HRDA-based UDA methods, leading to state-of-the-art segmentation performance. Our approach improves existing UDA-SS methods by 1.05% mIoU on GTA V --> Cityscapes and 1.04% mIoU on Synthia-->Cityscapes. The implementation of our framework is available at: https://github.com/Masrur02/AFRDA

AFRDA: Внимательное уточнение признаков для адаптивной семантической сегментации доменов

AFRDA: Attentive Feature Refinement for Domain Adaptive Semantic Segmentation

Аннотация

Support