医療超音波画像セグメンテーションにおける半教師付き学習と対照学習のためのマルチスケールスイッチ
Multiscale Switch for Semi-Supervised and Contrastive Learning in Medical Ultrasound Image Segmentation
March 19, 2026
著者: Jingguo Qu, Xinyang Han, Yao Pu, Man-Lik Chui, Simon Takadiyi Gunda, Ziman Chen, Jing Qin, Ann Dorothy King, Winnie Chiu-Wing Chu, Jing Cai, Michael Tin-Cheung Ying
cs.AI
要旨
医用超音波画像セグメンテーションは、限られたラベル付きデータと、スペックルノイズや低コントラスト境界といった特徴的な画像アーティファクトにより、大きな課題に直面している。データ不足に対処するため半教師あり学習(SSL)手法が登場しているが、既存手法は未ラベルデータの利用が最適でなく、頑健な特徴表現機構を欠いている。本論文では、新たなSSLフレームワーク「Switch」を提案する。主な革新点は二つある。(1) 階層的パッチ混合により均一な空間的カバレッジを実現するMultiscale Switch(MSS)戦略、(2) フーリエ空間での振幅交換により頑健な特徴表現を行う、対照学習を組み合わせたFrequency Domain Switch(FDS)である。本フレームワークはこれらの要素を教師生徒アーキテクチャに統合し、ラベル付きデータと未ラベルデータの両方を効果的に活用する。6つの多様な超音波データセット(リンパ節、乳腺病変、甲状腺結節、前立腺)による総合的な評価は、最新手法を一貫して上回る性能を示した。ラベル付け率5%の条件下では、Switchは顕著な改善を達成した:LN-INTデータセットでDice係数80.04%、DDTIデータセットで85.52%、前立腺データセットで83.48%を記録し、本半教師あり手法は完全教師ありベースラインを凌駕した。本手法は、優れた性能を発揮しつつもパラメータ効率(180万パラメータ)を維持しており、リソースが限られた医療画像応用における有効性が確認された。ソースコードはhttps://github.com/jinggqu/Switch で公開されている。
English
Medical ultrasound image segmentation faces significant challenges due to limited labeled data and characteristic imaging artifacts including speckle noise and low-contrast boundaries. While semi-supervised learning (SSL) approaches have emerged to address data scarcity, existing methods suffer from suboptimal unlabeled data utilization and lack robust feature representation mechanisms. In this paper, we propose Switch, a novel SSL framework with two key innovations: (1) Multiscale Switch (MSS) strategy that employs hierarchical patch mixing to achieve uniform spatial coverage; (2) Frequency Domain Switch (FDS) with contrastive learning that performs amplitude switching in Fourier space for robust feature representations. Our framework integrates these components within a teacher-student architecture to effectively leverage both labeled and unlabeled data. Comprehensive evaluation across six diverse ultrasound datasets (lymph nodes, breast lesions, thyroid nodules, and prostate) demonstrates consistent superiority over state-of-the-art methods. At 5\% labeling ratio, Switch achieves remarkable improvements: 80.04\% Dice on LN-INT, 85.52\% Dice on DDTI, and 83.48\% Dice on Prostate datasets, with our semi-supervised approach even exceeding fully supervised baselines. The method maintains parameter efficiency (1.8M parameters) while delivering superior performance, validating its effectiveness for resource-constrained medical imaging applications. The source code is publicly available at https://github.com/jinggqu/Switch