Interruptor Multiescala para Aprendizado Semissupervisionado e Contrastivo na Segmentação de Imagens Médicas por Ultrassom
Multiscale Switch for Semi-Supervised and Contrastive Learning in Medical Ultrasound Image Segmentation
March 19, 2026
Autores: Jingguo Qu, Xinyang Han, Yao Pu, Man-Lik Chui, Simon Takadiyi Gunda, Ziman Chen, Jing Qin, Ann Dorothy King, Winnie Chiu-Wing Chu, Jing Cai, Michael Tin-Cheung Ying
cs.AI
Resumo
A segmentação de imagens médicas por ultrassom enfrenta desafios significativos devido à escassez de dados anotados e a artefatos de imagem característicos, incluindo ruído speckle e limites de baixo contraste. Embora as abordagens de aprendizado semissupervisionado (SSL) tenham surgido para lidar com a escassez de dados, os métodos existentes sofrem com utilização subótima de dados não rotulados e carecem de mecanismos robustos de representação de características. Neste artigo, propomos o Switch, uma nova estrutura SSL com duas inovações principais: (1) Estratégia Multiscale Switch (MSS) que emprega mistura hierárquica de *patches* para alcançar cobertura espacial uniforme; (2) Frequency Domain Switch (FDS) com aprendizado contrastivo que realiza comutação de amplitude no espaço de Fourier para representações de características robustas. Nossa estrutura integra esses componentes em uma arquitetura professor-aluno para alavancar eficazmente dados rotulados e não rotulados. Avaliação abrangente em seis conjuntos de dados de ultrassom diversos (linfonodos, lesões mamárias, nódulos tireoidianos e próstata) demonstra superioridade consistente sobre os métodos state-of-the-art. Com taxa de rotulação de 5%, o Switch alcança melhorias notáveis: Dice de 80,04% em LN-INT, 85,52% em DDTI e 83,48% no conjunto de dados da Próstata, com nossa abordagem semissupervisionada superando até mesmo as linhas de base totalmente supervisionadas. O método mantém eficiência de parâmetros (1,8M de parâmetros) enquanto oferece desempenho superior, validando sua eficácia para aplicações de imageamento médico com recursos limitados. O código-fonte está publicamente disponível em https://github.com/jinggqu/Switch.
English
Medical ultrasound image segmentation faces significant challenges due to limited labeled data and characteristic imaging artifacts including speckle noise and low-contrast boundaries. While semi-supervised learning (SSL) approaches have emerged to address data scarcity, existing methods suffer from suboptimal unlabeled data utilization and lack robust feature representation mechanisms. In this paper, we propose Switch, a novel SSL framework with two key innovations: (1) Multiscale Switch (MSS) strategy that employs hierarchical patch mixing to achieve uniform spatial coverage; (2) Frequency Domain Switch (FDS) with contrastive learning that performs amplitude switching in Fourier space for robust feature representations. Our framework integrates these components within a teacher-student architecture to effectively leverage both labeled and unlabeled data. Comprehensive evaluation across six diverse ultrasound datasets (lymph nodes, breast lesions, thyroid nodules, and prostate) demonstrates consistent superiority over state-of-the-art methods. At 5\% labeling ratio, Switch achieves remarkable improvements: 80.04\% Dice on LN-INT, 85.52\% Dice on DDTI, and 83.48\% Dice on Prostate datasets, with our semi-supervised approach even exceeding fully supervised baselines. The method maintains parameter efficiency (1.8M parameters) while delivering superior performance, validating its effectiveness for resource-constrained medical imaging applications. The source code is publicly available at https://github.com/jinggqu/Switch