ChatPaper.aiChatPaper

SGDC: Strukturgeführte dynamische Faltung für die medizinische Bildsegmentierung

SGDC: Structurally-Guided Dynamic Convolution for Medical Image Segmentation

February 26, 2026
Autoren: Bo Shi, Wei-ping Zhu, M. N. S. Swamy
cs.AI

Zusammenfassung

Räumlich variante dynamische Faltungsoperationen bieten einen prinzipienbasierten Ansatz zur Integration räumlicher Adaptivität in tiefe neuronale Netze. In der medizinischen Segmentierung erzeugen gängige Verfahren dynamische Kernel jedoch häufig durch Average-Pooling, was hochfrequente räumliche Details implizit zu einer groben, räumlich komprimierten Darstellung reduziert und dadurch überglättete Vorhersagen verursacht, welche die Detailtreue feinstrukturierter klinischer Merkmale beeinträchtigen. Um diese Einschränkung zu überwinden, schlagen wir einen neuartigen Strukturgeführten Dynamischen Faltungsmechanismus (SGDC) vor, der einen explizit supervidierten Strukturextraktionszweig zur Steuerung der Erzeugung dynamischer Kernel und Gating-Signale für struktur-sensitive Merkmalsmodulation nutzt. Konkret werden hochpräzise Randinformationen aus diesem Hilfszweig mit semantischen Merkmalen fusioniert, um eine räumlich präzise Merkmalsmodulation zu ermöglichen. Durch den Ersatz von Kontextaggregation durch pixelweise Strukturführung verhindert der vorgeschlagene Ansatz effektiv den durch Average-Pooling verursachten Informationsverlust. Experimentelle Ergebnisse zeigen, dass SGDC auf den ISIC-2016-, PH2-, ISIC-2018- und CoNIC-Datensätzen state-of-the-art Leistung erzielt, eine überlegene Randtreue durch Reduktion der Hausdorff-Distanz (HD95) um 2.05 bietet und konsistente IoU-Steigerungen von 0.99%–1.49% gegenüber Pooling-basierten Baseline-Modellen erreicht. Darüber hinaus zeigt der Mechanismus großes Potenzial für die Übertragung auf andere struktur-sensitive Bildverarbeitungsaufgaben, wie die Detektion kleiner Objekte, und bietet somit eine prinzipienbasierte Lösung zum Erhalt struktureller Integrität in der medizinischen Bildanalyse. Zur Gewährleistung von Reproduzierbarkeit und Förderung weiterer Forschung wurde der Implementierungscode unserer SGE- und SGDC-Module unter https://github.com/solstice0621/SGDC öffentlich zugänglich gemacht.
English
Spatially variant dynamic convolution provides a principled approach of integrating spatial adaptivity into deep neural networks. However, mainstream designs in medical segmentation commonly generate dynamic kernels through average pooling, which implicitly collapses high-frequency spatial details into a coarse, spatially-compressed representation, leading to over-smoothed predictions that degrade the fidelity of fine-grained clinical structures. To address this limitation, we propose a novel Structure-Guided Dynamic Convolution (SGDC) mechanism, which leverages an explicitly supervised structure-extraction branch to guide the generation of dynamic kernels and gating signals for structure-aware feature modulation. Specifically, the high-fidelity boundary information from this auxiliary branch is fused with semantic features to enable spatially-precise feature modulation. By replacing context aggregation with pixel-wise structural guidance, the proposed design effectively prevents the information loss introduced by average pooling. Experimental results show that SGDC achieves state-of-the-art performance on ISIC 2016, PH2, ISIC 2018, and CoNIC datasets, delivering superior boundary fidelity by reducing the Hausdorff Distance (HD95) by 2.05, and providing consistent IoU gains of 0.99\%-1.49\% over pooling-based baselines. Moreover, the mechanism exhibits strong potential for extension to other fine-grained, structure-sensitive vision tasks, such as small-object detection, offering a principled solution for preserving structural integrity in medical image analysis. To facilitate reproducibility and encourage further research, the implementation code for both our SGE and SGDC modules has been is publicly released at https://github.com/solstice0621/SGDC.
PDF12May 8, 2026