AFRDA : Raffinement Attentif des Caractéristiques pour la Segmentation Sémantique Adaptative au Domaine
AFRDA: Attentive Feature Refinement for Domain Adaptive Semantic Segmentation
July 23, 2025
papers.authors: Md. Al-Masrur Khan, Durgakant Pushp, Lantao Liu
cs.AI
papers.abstract
Dans la segmentation sémantique adaptative de domaine non supervisée (UDA-SS), un modèle est entraîné sur des données annotées d'un domaine source (par exemple, des images synthétiques) puis adapté à un domaine cible non annoté (par exemple, des images du monde réel) sans accès aux annotations cibles. Les méthodes existantes en UDA-SS peinent souvent à équilibrer les détails locaux fins avec les informations contextuelles globales, ce qui entraîne des erreurs de segmentation dans les régions complexes. Pour résoudre ce problème, nous introduisons le module de Raffinement Adaptatif des Caractéristiques (AFR), qui améliore la précision de la segmentation en affinant les caractéristiques haute résolution à l'aide de connaissances sémantiques issues des logits basse résolution. AFR intègre également des composantes haute fréquence, qui capturent les structures fines et fournissent des informations cruciales sur les contours, améliorant ainsi la délimitation des objets. De plus, AFR équilibre de manière adaptative les informations locales et globales grâce à une attention pilotée par l'incertitude, réduisant ainsi les erreurs de classification. Sa conception légère permet une intégration transparente dans les méthodes UDA basées sur HRDA, conduisant à des performances de segmentation de pointe. Notre approche améliore les méthodes UDA-SS existantes de 1,05 % en mIoU sur GTA V --> Cityscapes et de 1,04 % en mIoU sur Synthia --> Cityscapes. L'implémentation de notre framework est disponible à l'adresse suivante : https://github.com/Masrur02/AFRDA
English
In Unsupervised Domain Adaptive Semantic Segmentation (UDA-SS), a model is
trained on labeled source domain data (e.g., synthetic images) and adapted to
an unlabeled target domain (e.g., real-world images) without access to target
annotations. Existing UDA-SS methods often struggle to balance fine-grained
local details with global contextual information, leading to segmentation
errors in complex regions. To address this, we introduce the Adaptive Feature
Refinement (AFR) module, which enhances segmentation accuracy by refining
highresolution features using semantic priors from low-resolution logits. AFR
also integrates high-frequency components, which capture fine-grained
structures and provide crucial boundary information, improving object
delineation. Additionally, AFR adaptively balances local and global information
through uncertaintydriven attention, reducing misclassifications. Its
lightweight design allows seamless integration into HRDA-based UDA methods,
leading to state-of-the-art segmentation performance. Our approach improves
existing UDA-SS methods by 1.05% mIoU on GTA V --> Cityscapes and 1.04% mIoU on
Synthia-->Cityscapes. The implementation of our framework is available at:
https://github.com/Masrur02/AFRDA