SGDC : Convolution Dynamique Guidée Structurellement pour la Segmentation d'Images Médicales
SGDC: Structurally-Guided Dynamic Convolution for Medical Image Segmentation
February 26, 2026
Auteurs: Bo Shi, Wei-ping Zhu, M. N. S. Swamy
cs.AI
Résumé
La convolution dynamique spatialement variable offre une approche fondée pour intégrer l'adaptativité spatiale dans les réseaux de neurones profonds. Cependant, les conceptions dominantes en segmentation médicale génèrent généralement des noyaux dynamiques par pooling moyen, ce qui réduit implicitement les détails spatiaux haute fréquence en une représentation grossière et spatialement compressée, conduisant à des prédictions excessivement lissées qui dégradent la fidélité des structures cliniques fines. Pour remédier à cette limitation, nous proposons un nouveau mécanisme de Convolution Dynamique Guidée par la Structure (SGDC), qui exploite une branche d'extraction de structure explicitement supervisée pour guider la génération de noyaux dynamiques et de signaux de gating pour une modulation de caractéristiques sensible à la structure. Spécifiquement, les informations de frontière haute fidélité de cette branche auxiliaire sont fusionnées avec les caractéristiques sémantiques pour permettre une modulation spatialement précise des caractéristiques. En remplaçant l'agrégation de contexte par un guidage structurel pixel à pixel, la conception proposée prévient efficacement la perte d'information introduite par le pooling moyen. Les résultats expérimentaux montrent que SGDC obtient des performances de pointe sur les jeux de données ISIC 2016, PH2, ISIC 2018 et CoNIC, offrant une fidélité de contour supérieure en réduisant la distance de Hausdorff (HD95) de 2,05 et procurant des gains d'IoU constants de 0,99 % à 1,49 % par rapport aux méthodes basées sur le pooling. De plus, le mécanisme présente un fort potentiel d'extension à d'autres tâches vision fines et sensibles à la structure, telles que la détection de petits objets, offrant une solution fondée pour préserver l'intégrité structurelle en analyse d'images médicales. Pour faciliter la reproductibilité et encourager la recherche, le code d'implémentation de nos modules SGE et SGDC a été publiquement diffusé à l'adresse https://github.com/solstice0621/SGDC.
English
Spatially variant dynamic convolution provides a principled approach of integrating spatial adaptivity into deep neural networks. However, mainstream designs in medical segmentation commonly generate dynamic kernels through average pooling, which implicitly collapses high-frequency spatial details into a coarse, spatially-compressed representation, leading to over-smoothed predictions that degrade the fidelity of fine-grained clinical structures. To address this limitation, we propose a novel Structure-Guided Dynamic Convolution (SGDC) mechanism, which leverages an explicitly supervised structure-extraction branch to guide the generation of dynamic kernels and gating signals for structure-aware feature modulation. Specifically, the high-fidelity boundary information from this auxiliary branch is fused with semantic features to enable spatially-precise feature modulation. By replacing context aggregation with pixel-wise structural guidance, the proposed design effectively prevents the information loss introduced by average pooling. Experimental results show that SGDC achieves state-of-the-art performance on ISIC 2016, PH2, ISIC 2018, and CoNIC datasets, delivering superior boundary fidelity by reducing the Hausdorff Distance (HD95) by 2.05, and providing consistent IoU gains of 0.99\%-1.49\% over pooling-based baselines. Moreover, the mechanism exhibits strong potential for extension to other fine-grained, structure-sensitive vision tasks, such as small-object detection, offering a principled solution for preserving structural integrity in medical image analysis. To facilitate reproducibility and encourage further research, the implementation code for both our SGE and SGDC modules has been is publicly released at https://github.com/solstice0621/SGDC.