SDF-Net: Aprendizaje de Características Disentrelazadas con Conciencia Estructural para la Re-identificación de Buques Óptico-SAR

Resumen

La reidentificación de buques (ReID) multimodal entre imágenes ópticas y de radar de apertura sintética (SAR) se enfrenta al desafío fundamental de la severa discrepancia radiométrica entre la imagen óptica pasiva y la percepción activa coherente del radar. Si bien los enfoques existentes se basan principalmente en la alineación de distribuciones estadísticas o en la correspondencia semántica, a menudo pasan por alto un principio físico crítico: los buques son objetos rígidos cuyas estructuras geométricas se mantienen estables entre modalidades de percepción, mientras que la apariencia textural es altamente dependiente de la modalidad. En este trabajo, proponemos SDF-Net, una Red de Aprendizaje de Características Disociadas con Conciencia Estructural que incorpora sistemáticamente la consistencia geométrica en la ReID óptica-SAR de buques. Construida sobre una arquitectura base ViT, SDF-Net introduce una restricción de consistencia estructural que extrae estadísticas de energía de gradiente invariantes a la escala de las capas intermedias para anclar robustamente las representaciones frente a variaciones radiométricas. En la etapa final, SDF-Net disocia las representaciones aprendidas en características de identidad invariantes a la modalidad y características específicas de la modalidad. Estas claves disociadas se integran posteriormente mediante una fusión residual aditiva sin parámetros, mejorando eficazmente el poder discriminativo. Experimentos exhaustivos en el conjunto de datos HOSS-ReID demuestran que SDF-Net supera consistentemente a los métodos estado del arte existentes. El código y los modelos entrenados están disponibles públicamente en https://github.com/cfrfree/SDF-Net.

English

Cross-modal ship re-identification (ReID) between optical and synthetic aperture radar (SAR) imagery is fundamentally challenged by the severe radiometric discrepancy between passive optical imaging and coherent active radar sensing. While existing approaches primarily rely on statistical distribution alignment or semantic matching, they often overlook a critical physical prior: ships are rigid objects whose geometric structures remain stable across sensing modalities, whereas texture appearance is highly modality-dependent. In this work, we propose SDF-Net, a Structure-Aware Disentangled Feature Learning Network that systematically incorporates geometric consistency into optical--SAR ship ReID. Built upon a ViT backbone, SDF-Net introduces a structure consistency constraint that extracts scale-invariant gradient energy statistics from intermediate layers to robustly anchor representations against radiometric variations. At the terminal stage, SDF-Net disentangles the learned representations into modality-invariant identity features and modality-specific characteristics. These decoupled cues are then integrated through a parameter-free additive residual fusion, effectively enhancing discriminative power. Extensive experiments on the HOSS-ReID dataset demonstrate that SDF-Net consistently outperforms existing state-of-the-art methods. The code and trained models are publicly available at https://github.com/cfrfree/SDF-Net.

SDF-Net: Aprendizaje de Características Disentrelazadas con Conciencia Estructural para la Re-identificación de Buques Óptico-SAR

SDF-Net: Structure-Aware Disentangled Feature Learning for Opticall-SAR Ship Re-identification

Resumen

Support