SGDC: 医用画像セグメンテーションのための構造誘導型動的畳み込み
SGDC: Structurally-Guided Dynamic Convolution for Medical Image Segmentation
February 26, 2026
著者: Bo Shi, Wei-ping Zhu, M. N. S. Swamy
cs.AI
要旨
空間的に変化する動的畿み込みは、深層ニューラルネットワークに空間適応性を組み込む原理的なアプローチを提供する。しかし、医療画像セグメンテーションにおける主流の設計では、動的カーネルを平均プーリングによって生成することが一般的であり、これは高周波の空間詳細を暗黙的に圧縮された粗い表現に集約してしまう。これにより、細粒度の臨床構造の忠実度を損なう過度に平滑化された予測が生じる。この課題を解決するため、我々は構造誘導型動的畿み込み(SGDC)機構を提案する。この機構は、明示的に教師付けされた構造抽出ブランチを利用して、構造を考慮した特徴変調のための動的カーネルとゲーティング信号の生成を誘導する。具体的には、この補助ブランチから得られる高忠実度の境界情報を意味的特徴と融合し、空間的に精密な特徴変調を実現する。コンテキスト集約をピクセル単位の構造誘導に置き換えることで、提案手法は平均プーリングに起因する情報損失を効果的に防止する。実験結果により、SGDCがISIC 2016、PH2、ISIC 2018、CoNICデータセットにおいて最先端の性能を達成し、Hausdorff距離(HD95)を2.05改善して優れた境界忠実度を実現し、プーリングベースのベースラインに対して0.99%~1.49%の一貫したIoU向上を提供することが示された。さらに、本機構は小物体検出などの他の細粒度で構造に敏感な視覚タスクへの拡張において強い可能性を示し、医療画像分析における構造的完全性保持の原理的な解決策を提供する。再現性の確保と研究の促進のため、SGEおよびSGDCモジュールの実装コードをhttps://github.com/solstice0621/SGDC で公開した。
English
Spatially variant dynamic convolution provides a principled approach of integrating spatial adaptivity into deep neural networks. However, mainstream designs in medical segmentation commonly generate dynamic kernels through average pooling, which implicitly collapses high-frequency spatial details into a coarse, spatially-compressed representation, leading to over-smoothed predictions that degrade the fidelity of fine-grained clinical structures. To address this limitation, we propose a novel Structure-Guided Dynamic Convolution (SGDC) mechanism, which leverages an explicitly supervised structure-extraction branch to guide the generation of dynamic kernels and gating signals for structure-aware feature modulation. Specifically, the high-fidelity boundary information from this auxiliary branch is fused with semantic features to enable spatially-precise feature modulation. By replacing context aggregation with pixel-wise structural guidance, the proposed design effectively prevents the information loss introduced by average pooling. Experimental results show that SGDC achieves state-of-the-art performance on ISIC 2016, PH2, ISIC 2018, and CoNIC datasets, delivering superior boundary fidelity by reducing the Hausdorff Distance (HD95) by 2.05, and providing consistent IoU gains of 0.99\%-1.49\% over pooling-based baselines. Moreover, the mechanism exhibits strong potential for extension to other fine-grained, structure-sensitive vision tasks, such as small-object detection, offering a principled solution for preserving structural integrity in medical image analysis. To facilitate reproducibility and encourage further research, the implementation code for both our SGE and SGDC modules has been is publicly released at https://github.com/solstice0621/SGDC.