SDF-Net : Apprentissage de caractéristiques dissociées prenant en compte la structure pour la ré-identification de navires optique-RSO

Résumé

La ré-identification (ReID) intermodale de navires entre les images optiques et les images radar à synthèse d'ouverture (SAR) est fondamentalement compliquée par l'écart radiométrique important entre l'imagerie optique passive et la télédétection radar active cohérente. Si les approches existantes reposent principalement sur l'alignement des distributions statistiques ou l'appariement sémantique, elles négligent souvent un principe physique critique : les navires sont des objets rigides dont les structures géométriques restent stables quelles que soient les modalités de détection, tandis que l'apparence texturale est fortement dépendante de la modalité. Dans ce travail, nous proposons SDF-Net, un réseau d'apprentissage de caractéristiques dissociées sensible à la structure, qui intègre systématiquement la cohérence géométrique dans la ReID de navires optique-SAR. Construit sur une architecture de base de type ViT, SDF-Net introduit une contrainte de cohérence structurelle qui extrait des statistiques d'énergie de gradient invariantes à l'échelle des couches intermédiaires pour ancrer robustement les représentations face aux variations radiométriques. Au stade terminal, SDF-Net dissocie les représentations apprises en caractéristiques d'identité invariantes à la modalité et en caractéristiques spécifiques à la modalité. Ces indices découplés sont ensuite intégrés via une fusion résiduelle additive sans paramètre, améliorant efficacement le pouvoir discriminant. Des expériences approfondies sur le jeu de données HOSS-ReID démontrent que SDF-Net surpasse constamment les méthodes état de l'art existantes. Le code et les modèles entraînés sont disponibles publiquement à l'adresse https://github.com/cfrfree/SDF-Net.

English

Cross-modal ship re-identification (ReID) between optical and synthetic aperture radar (SAR) imagery is fundamentally challenged by the severe radiometric discrepancy between passive optical imaging and coherent active radar sensing. While existing approaches primarily rely on statistical distribution alignment or semantic matching, they often overlook a critical physical prior: ships are rigid objects whose geometric structures remain stable across sensing modalities, whereas texture appearance is highly modality-dependent. In this work, we propose SDF-Net, a Structure-Aware Disentangled Feature Learning Network that systematically incorporates geometric consistency into optical--SAR ship ReID. Built upon a ViT backbone, SDF-Net introduces a structure consistency constraint that extracts scale-invariant gradient energy statistics from intermediate layers to robustly anchor representations against radiometric variations. At the terminal stage, SDF-Net disentangles the learned representations into modality-invariant identity features and modality-specific characteristics. These decoupled cues are then integrated through a parameter-free additive residual fusion, effectively enhancing discriminative power. Extensive experiments on the HOSS-ReID dataset demonstrate that SDF-Net consistently outperforms existing state-of-the-art methods. The code and trained models are publicly available at https://github.com/cfrfree/SDF-Net.

SDF-Net : Apprentissage de caractéristiques dissociées prenant en compte la structure pour la ré-identification de navires optique-RSO

SDF-Net: Structure-Aware Disentangled Feature Learning for Opticall-SAR Ship Re-identification

Résumé

Support