ChatPaper.aiChatPaper

AFRDA : Raffinement Attentif des Caractéristiques pour la Segmentation Sémantique Adaptative au Domaine

AFRDA: Attentive Feature Refinement for Domain Adaptive Semantic Segmentation

July 23, 2025
papers.authors: Md. Al-Masrur Khan, Durgakant Pushp, Lantao Liu
cs.AI

papers.abstract

Dans la segmentation sémantique adaptative de domaine non supervisée (UDA-SS), un modèle est entraîné sur des données annotées d'un domaine source (par exemple, des images synthétiques) puis adapté à un domaine cible non annoté (par exemple, des images du monde réel) sans accès aux annotations cibles. Les méthodes existantes en UDA-SS peinent souvent à équilibrer les détails locaux fins avec les informations contextuelles globales, ce qui entraîne des erreurs de segmentation dans les régions complexes. Pour résoudre ce problème, nous introduisons le module de Raffinement Adaptatif des Caractéristiques (AFR), qui améliore la précision de la segmentation en affinant les caractéristiques haute résolution à l'aide de connaissances sémantiques issues des logits basse résolution. AFR intègre également des composantes haute fréquence, qui capturent les structures fines et fournissent des informations cruciales sur les contours, améliorant ainsi la délimitation des objets. De plus, AFR équilibre de manière adaptative les informations locales et globales grâce à une attention pilotée par l'incertitude, réduisant ainsi les erreurs de classification. Sa conception légère permet une intégration transparente dans les méthodes UDA basées sur HRDA, conduisant à des performances de segmentation de pointe. Notre approche améliore les méthodes UDA-SS existantes de 1,05 % en mIoU sur GTA V --> Cityscapes et de 1,04 % en mIoU sur Synthia --> Cityscapes. L'implémentation de notre framework est disponible à l'adresse suivante : https://github.com/Masrur02/AFRDA
English
In Unsupervised Domain Adaptive Semantic Segmentation (UDA-SS), a model is trained on labeled source domain data (e.g., synthetic images) and adapted to an unlabeled target domain (e.g., real-world images) without access to target annotations. Existing UDA-SS methods often struggle to balance fine-grained local details with global contextual information, leading to segmentation errors in complex regions. To address this, we introduce the Adaptive Feature Refinement (AFR) module, which enhances segmentation accuracy by refining highresolution features using semantic priors from low-resolution logits. AFR also integrates high-frequency components, which capture fine-grained structures and provide crucial boundary information, improving object delineation. Additionally, AFR adaptively balances local and global information through uncertaintydriven attention, reducing misclassifications. Its lightweight design allows seamless integration into HRDA-based UDA methods, leading to state-of-the-art segmentation performance. Our approach improves existing UDA-SS methods by 1.05% mIoU on GTA V --> Cityscapes and 1.04% mIoU on Synthia-->Cityscapes. The implementation of our framework is available at: https://github.com/Masrur02/AFRDA
PDF12July 29, 2025