ChatPaper.aiChatPaper

SGDC: Convolução Dinâmica Guiada Estruturalmente para Segmentação de Imagens Médicas

SGDC: Structurally-Guided Dynamic Convolution for Medical Image Segmentation

February 26, 2026
Autores: Bo Shi, Wei-ping Zhu, M. N. S. Swamy
cs.AI

Resumo

A convolução dinâmica espacialmente variante oferece uma abordagem fundamentada para integrar a adaptabilidade espacial em redes neurais profundas. No entanto, os projetos predominantes na segmentação média geralmente geram kernels dinâmicos por meio de _average pooling_, o que implicitamente colapsa detalhes espaciais de alta frequência numa representação grosseira e espacialmente comprimida, levando a previsões excessivamente suavizadas que degradam a fidelidade de estruturas clínicas de granularidade fina. Para superar esta limitação, propomos um novo mecanismo de Convolução Dinâmica Guiada por Estrutura (SGDC), que aproveita um ramo de extração de estrutura explicitamente supervisionado para orientar a geração de kernels dinâmicos e sinais de _gating_ para modulação de características consciente da estrutura. Especificamente, a informação de limites de alta fidelidade deste ramo auxiliar é fundida com características semânticas para permitir uma modulação de características espacialmente precisa. Ao substituir a agregação de contexto por uma orientação estrutural _pixel-wise_, o projeto proposto evita efetivamente a perda de informação introduzida pelo _average pooling_. Resultados experimentais mostram que o SGDC alcança desempenho de ponta nos conjuntos de dados ISIC 2016, PH2, ISIC 2018 e CoNIC, fornecendo fidelidade de limites superior ao reduzir a Distância de Hausdorff (HD95) em 2,05 e oferecendo ganhos consistentes de IoU de 0,99% a 1,49% sobre linhas de base baseadas em _pooling_. Adicionalmente, o mecanismo exibe forte potencial de extensão para outras tarefas visuais sensíveis à estrutura e de granularidade fina, como detecção de pequenos objetos, oferecendo uma solução fundamentada para preservar a integridade estrutural na análise de imagens médicas. Para facilitar a reprodutibilidade e incentivar pesquisas futuras, o código de implementação para os nossos módulos SGE e SGDC foi disponibilizado publicamente em https://github.com/solstice0621/SGDC.
English
Spatially variant dynamic convolution provides a principled approach of integrating spatial adaptivity into deep neural networks. However, mainstream designs in medical segmentation commonly generate dynamic kernels through average pooling, which implicitly collapses high-frequency spatial details into a coarse, spatially-compressed representation, leading to over-smoothed predictions that degrade the fidelity of fine-grained clinical structures. To address this limitation, we propose a novel Structure-Guided Dynamic Convolution (SGDC) mechanism, which leverages an explicitly supervised structure-extraction branch to guide the generation of dynamic kernels and gating signals for structure-aware feature modulation. Specifically, the high-fidelity boundary information from this auxiliary branch is fused with semantic features to enable spatially-precise feature modulation. By replacing context aggregation with pixel-wise structural guidance, the proposed design effectively prevents the information loss introduced by average pooling. Experimental results show that SGDC achieves state-of-the-art performance on ISIC 2016, PH2, ISIC 2018, and CoNIC datasets, delivering superior boundary fidelity by reducing the Hausdorff Distance (HD95) by 2.05, and providing consistent IoU gains of 0.99\%-1.49\% over pooling-based baselines. Moreover, the mechanism exhibits strong potential for extension to other fine-grained, structure-sensitive vision tasks, such as small-object detection, offering a principled solution for preserving structural integrity in medical image analysis. To facilitate reproducibility and encourage further research, the implementation code for both our SGE and SGDC modules has been is publicly released at https://github.com/solstice0621/SGDC.
PDF12March 7, 2026