SGDC: Structureel-Gestuurde Dynamische Convolutie voor Medische Beeldsegmentatie
SGDC: Structurally-Guided Dynamic Convolution for Medical Image Segmentation
February 26, 2026
Auteurs: Bo Shi, Wei-ping Zhu, M. N. S. Swamy
cs.AI
Samenvatting
Ruimtelijk variante dynamische convolutie biedt een principiële benadering om ruimtelijke adaptiviteit in diepe neurale netwerken te integreren. Hoofdstroomontwerpen in medische segmentatie genereren dynamische kernels echter vaak via gemiddelde pooling, wat hoogfrequente ruimtelijke details impliciet samenvouwt tot een grove, ruimtelijk gecomprimeerde representatie. Dit leidt tot over-uitgevlakte voorspellingen die de fideliteit van fijnmazige klinische structuren aantasten. Om deze beperking aan te pakken, stellen we een nieuwe Structure-Guided Dynamic Convolution (SGDC)-mechanisme voor, dat een expliciet gesuperviseerde structuurextractietak gebruikt om de generatie van dynamische kernels en gating-signalen te sturen voor structuurbewuste featuremodulatie. Concreet wordt de hoogfideliteitsgrensinformatie van deze hulptak gefuseerd met semantieke features om ruimtelijk precieze featuremodulatie mogelijk te maken. Door contextaggregatie te vervangen door pixelgewijze structurele begeleiding, voorkomt het voorgestelde ontwerp effectief het informatieverlies veroorzaakt door gemiddelde pooling. Experimentele resultaten tonen aan dat SGDC state-of-the-art prestaties behaalt op de ISIC 2016, PH2, ISIC 2018 en CoNIC datasets, met superieure grensfideliteit door de Hausdorff-afstand (HD95) met 2,05 te verminderen en consistente IoU-winsten van 0,99%-1,49% ten opzichte van op pooling gebaseerde basislijnen. Bovendien vertoont het mechanisme een sterk potentieel voor uitbreiding naar andere fijnmazige, structuurgevoelige visietaken, zoals detectie van kleine objecten, en biedt het een principiële oplossing voor het behoud van structurele integriteit in medische beeldanalyse. Om reproduceerbaarheid te vergemakkelijken en verder onderzoek aan te moedigen, is de implementatiecode van zowel onze SGE- als SGDC-modules openbaar vrijgegeven op https://github.com/solstice0621/SGDC.
English
Spatially variant dynamic convolution provides a principled approach of integrating spatial adaptivity into deep neural networks. However, mainstream designs in medical segmentation commonly generate dynamic kernels through average pooling, which implicitly collapses high-frequency spatial details into a coarse, spatially-compressed representation, leading to over-smoothed predictions that degrade the fidelity of fine-grained clinical structures. To address this limitation, we propose a novel Structure-Guided Dynamic Convolution (SGDC) mechanism, which leverages an explicitly supervised structure-extraction branch to guide the generation of dynamic kernels and gating signals for structure-aware feature modulation. Specifically, the high-fidelity boundary information from this auxiliary branch is fused with semantic features to enable spatially-precise feature modulation. By replacing context aggregation with pixel-wise structural guidance, the proposed design effectively prevents the information loss introduced by average pooling. Experimental results show that SGDC achieves state-of-the-art performance on ISIC 2016, PH2, ISIC 2018, and CoNIC datasets, delivering superior boundary fidelity by reducing the Hausdorff Distance (HD95) by 2.05, and providing consistent IoU gains of 0.99\%-1.49\% over pooling-based baselines. Moreover, the mechanism exhibits strong potential for extension to other fine-grained, structure-sensitive vision tasks, such as small-object detection, offering a principled solution for preserving structural integrity in medical image analysis. To facilitate reproducibility and encourage further research, the implementation code for both our SGE and SGDC modules has been is publicly released at https://github.com/solstice0621/SGDC.