Многомасштабный переключатель для полуавтоматического и контрастного обучения при сегментации медицинских ультразвуковых изображений
Multiscale Switch for Semi-Supervised and Contrastive Learning in Medical Ultrasound Image Segmentation
March 19, 2026
Авторы: Jingguo Qu, Xinyang Han, Yao Pu, Man-Lik Chui, Simon Takadiyi Gunda, Ziman Chen, Jing Qin, Ann Dorothy King, Winnie Chiu-Wing Chu, Jing Cai, Michael Tin-Cheung Ying
cs.AI
Аннотация
Сегментация медицинских ультразвуковых изображений сталкивается со значительными трудностями из-за ограниченного количества размеченных данных и характерных артефактов визуализации, включая спекл-шум и низкоконтрастные границы. Хотя для решения проблемы нехватки данных появились подходы полуконтролируемого обучения (semi-supervised learning, SSL), существующие методы страдают от неоптимального использования немаркированных данных и не имеют надежных механизмов представления признаков. В данной статье мы предлагаем Switch — новую SSL-структуру с двумя ключевыми инновациями: (1) стратегия Multiscale Switch (MSS), использующая иерархическое смешивание патчей для достижения равномерного пространственного охвата; (2) Frequency Domain Switch (FDS) с контрастным обучением, выполняющий переключение амплитуд в фурье-пространстве для получения устойчивых представлений признаков. Наша структура интегрирует эти компоненты в архитектуру «учитель-ученик» для эффективного использования как размеченных, так и немаркированных данных. Комплексная оценка на шести разнородных ультразвуковых наборах данных (лимфатические узлы, поражения молочной железы, узлы щитовидной железы и простата) демонстрирует последовательное превосходство над современными методами. При доле размеченных данных 5% Switch достигает значительного улучшения: 80,04% Dice на LN-INT, 85,52% Dice на DDTI и 83,48% Dice на наборе данных по простате, при этом наш полуконтролируемый подход даже превосходит полностью контролируемые базовые методы. Метод сохраняет параметрическую эффективность (1,8 млн параметров), обеспечивая при этом превосходную производительность, что подтверждает его эффективность для медицинских задач визуализации с ограниченными ресурсами. Исходный код общедоступен по адресу https://github.com/jinggqu/Switch.
English
Medical ultrasound image segmentation faces significant challenges due to limited labeled data and characteristic imaging artifacts including speckle noise and low-contrast boundaries. While semi-supervised learning (SSL) approaches have emerged to address data scarcity, existing methods suffer from suboptimal unlabeled data utilization and lack robust feature representation mechanisms. In this paper, we propose Switch, a novel SSL framework with two key innovations: (1) Multiscale Switch (MSS) strategy that employs hierarchical patch mixing to achieve uniform spatial coverage; (2) Frequency Domain Switch (FDS) with contrastive learning that performs amplitude switching in Fourier space for robust feature representations. Our framework integrates these components within a teacher-student architecture to effectively leverage both labeled and unlabeled data. Comprehensive evaluation across six diverse ultrasound datasets (lymph nodes, breast lesions, thyroid nodules, and prostate) demonstrates consistent superiority over state-of-the-art methods. At 5\% labeling ratio, Switch achieves remarkable improvements: 80.04\% Dice on LN-INT, 85.52\% Dice on DDTI, and 83.48\% Dice on Prostate datasets, with our semi-supervised approach even exceeding fully supervised baselines. The method maintains parameter efficiency (1.8M parameters) while delivering superior performance, validating its effectiveness for resource-constrained medical imaging applications. The source code is publicly available at https://github.com/jinggqu/Switch