SGDC: Структурно-управляемая динамическая свертка для сегментации медицинских изображений
SGDC: Structurally-Guided Dynamic Convolution for Medical Image Segmentation
February 26, 2026
Авторы: Bo Shi, Wei-ping Zhu, M. N. S. Swamy
cs.AI
Аннотация
Пространственно-вариативная динамическая свертка предлагает принципиальный подход к интеграции пространственной адаптивности в глубокие нейронные сети. Однако в основных подходах, применяемых в медицинской сегментации, динамические ядра обычно генерируются с помощью усредняющего пулинга, что неявно приводит к схлопыванию высокочастотных пространственных деталей в грубое, пространственно-сжатое представление. Это, в свою очередь, ведет к излишне сглаженным прогнозам, снижающим точность воспроизведения мелкозернистых клинических структур. Для преодоления этого ограничения мы предлагаем новый механизм Структурно-направленной динамической свертки (Structure-Guided Dynamic Convolution, SGDC), который использует явно обученную ветвь выделения структур для управления генерацией динамических ядер и сигналов затвора с целью модуляции признаков с учетом структуры. В частности, высокоточная информация о границах из этой вспомогательной ветви объединяется с семантическими признаками для обеспечения пространственно-точного преобразования признаков. Заменяя агрегацию контекста на поточечное структурное руководство, предложенная архитектура эффективно предотвращает потерю информации, вызванную усредняющим пулингом. Результаты экспериментов показывают, что SGDC достигает наилучших результатов на наборах данных ISIC 2016, PH2, ISIC 2018 и CoNIC, обеспечивая превосходную точность границ за счет снижения расстояния Хаусдорфа (HD95) на 2.05 и демонстрируя стабильное улучшение показателя IoU на 0.99%–1.49% по сравнению с базовыми методами на основе пулинга. Более того, механизм демонстрирует значительный потенциал для распространения на другие мелкозернистые, структурно-чувствительные задачи компьютерного зрения, такие как обнаружение малых объектов, предлагая принципиальное решение для сохранения структурной целостности в анализе медицинских изображений. Для обеспечения воспроизводимости и стимулирования дальнейших исследований код реализации наших модулей SGE и SGDC находится в открытом доступе по адресу https://github.com/solstice0621/SGDC.
English
Spatially variant dynamic convolution provides a principled approach of integrating spatial adaptivity into deep neural networks. However, mainstream designs in medical segmentation commonly generate dynamic kernels through average pooling, which implicitly collapses high-frequency spatial details into a coarse, spatially-compressed representation, leading to over-smoothed predictions that degrade the fidelity of fine-grained clinical structures. To address this limitation, we propose a novel Structure-Guided Dynamic Convolution (SGDC) mechanism, which leverages an explicitly supervised structure-extraction branch to guide the generation of dynamic kernels and gating signals for structure-aware feature modulation. Specifically, the high-fidelity boundary information from this auxiliary branch is fused with semantic features to enable spatially-precise feature modulation. By replacing context aggregation with pixel-wise structural guidance, the proposed design effectively prevents the information loss introduced by average pooling. Experimental results show that SGDC achieves state-of-the-art performance on ISIC 2016, PH2, ISIC 2018, and CoNIC datasets, delivering superior boundary fidelity by reducing the Hausdorff Distance (HD95) by 2.05, and providing consistent IoU gains of 0.99\%-1.49\% over pooling-based baselines. Moreover, the mechanism exhibits strong potential for extension to other fine-grained, structure-sensitive vision tasks, such as small-object detection, offering a principled solution for preserving structural integrity in medical image analysis. To facilitate reproducibility and encourage further research, the implementation code for both our SGE and SGDC modules has been is publicly released at https://github.com/solstice0621/SGDC.