의학 초음파 영상 분할을 위한 준지도 및 대조 학습용 멀티스케일 스위치
Multiscale Switch for Semi-Supervised and Contrastive Learning in Medical Ultrasound Image Segmentation
March 19, 2026
저자: Jingguo Qu, Xinyang Han, Yao Pu, Man-Lik Chui, Simon Takadiyi Gunda, Ziman Chen, Jing Qin, Ann Dorothy King, Winnie Chiu-Wing Chu, Jing Cai, Michael Tin-Cheung Ying
cs.AI
초록
의료 초음파 영상 분할은 레이블이 지정된 데이터의 한계와 스페클 노이즈, 낮은 대비의 경계 등 특유의 영상 아티팩트로 인해 상당한 어려움에 직면해 있습니다. 레이블 없는 데이터를 활용한 준지도 학습 방법이 데이터 부족 문제를 해결하기 위해 등장했지만, 기존 방법들은 레이블 없는 데이터 활용이 최적화되지 않았고 강력한 특징 표현 메커니즘을 갖추지 못했습니다. 본 논문에서는 두 가지 핵심 혁신을 통해 이러한 문제를 해결하는 새로운 준지도 학습 프레임워크인 Switch를 제안합니다: (1) 계층적 패치 혼합을 통해 균일한 공간 커버리지를 달성하는 Multiscale Switch(MSS) 전략, (2) 푸리에 공간에서 진폭 전환을 수행하여 강력한 특징 표현을 학습하는 Frequency Domain Switch(FDS)와 대조 학습. 본 프레임워크는 이러한 구성 요소를 교사-학생 구조 내에 통합하여 레이블이 지정된 데이터와 레이블 없는 데이터를 효과적으로 활용합니다. 림프절, 유방 병변, 갑상선 결절, 전립선 등 6가지 다양한 초음파 데이터셋에 대한 포괄적 평가를 통해 최신 방법 대비 일관된 우수성을 입증했습니다. 5% 레이블링 비율에서 Switch는 LN-INT 데이터셋에서 80.04% Dice, DDTI에서 85.52% Dice, 전립선 데이터셋에서 83.48% Dice라는 주목할 만한 성능 향상을 달성했으며, 본 준지도 학습 접근법은 완전 지도 학습 기준선을 능가하기도 했습니다. 본 방법은 매개변수 효율성(180만 개 매개변수)을 유지하면서도 우수한 성능을 제공하여 자원이 제한된 의료 영상 응용 분야에서의 효과성을 입증했습니다. 소스 코드는 https://github.com/jinggqu/Switch에서 공개되어 있습니다.
English
Medical ultrasound image segmentation faces significant challenges due to limited labeled data and characteristic imaging artifacts including speckle noise and low-contrast boundaries. While semi-supervised learning (SSL) approaches have emerged to address data scarcity, existing methods suffer from suboptimal unlabeled data utilization and lack robust feature representation mechanisms. In this paper, we propose Switch, a novel SSL framework with two key innovations: (1) Multiscale Switch (MSS) strategy that employs hierarchical patch mixing to achieve uniform spatial coverage; (2) Frequency Domain Switch (FDS) with contrastive learning that performs amplitude switching in Fourier space for robust feature representations. Our framework integrates these components within a teacher-student architecture to effectively leverage both labeled and unlabeled data. Comprehensive evaluation across six diverse ultrasound datasets (lymph nodes, breast lesions, thyroid nodules, and prostate) demonstrates consistent superiority over state-of-the-art methods. At 5\% labeling ratio, Switch achieves remarkable improvements: 80.04\% Dice on LN-INT, 85.52\% Dice on DDTI, and 83.48\% Dice on Prostate datasets, with our semi-supervised approach even exceeding fully supervised baselines. The method maintains parameter efficiency (1.8M parameters) while delivering superior performance, validating its effectiveness for resource-constrained medical imaging applications. The source code is publicly available at https://github.com/jinggqu/Switch