Commutateur multi-échelle pour l'apprentissage semi-supervisé et contrastif dans la segmentation d'images échographiques médicales
Multiscale Switch for Semi-Supervised and Contrastive Learning in Medical Ultrasound Image Segmentation
March 19, 2026
Auteurs: Jingguo Qu, Xinyang Han, Yao Pu, Man-Lik Chui, Simon Takadiyi Gunda, Ziman Chen, Jing Qin, Ann Dorothy King, Winnie Chiu-Wing Chu, Jing Cai, Michael Tin-Cheung Ying
cs.AI
Résumé
La segmentation d'images médicales par ultrasons est confrontée à des défis significatifs en raison du nombre limité de données annotées et d'artéfacts d'imagerie caractéristiques, incluant le bruit de speckle et les contours à faible contraste. Bien que les approches d'apprentissage semi-supervisé (SSL) aient émergé pour pallier la pénurie de données, les méthodes existantes souffrent d'une utilisation sous-optimale des données non étiquetées et manquent de mécanismes robustes de représentation des caractéristiques. Dans cet article, nous proposons Switch, un nouveau cadre SSL avec deux innovations clés : (1) une stratégie de Commutation Multi-échelle (MSS) qui utilise un mélange hiérarchique de patchs pour obtenir une couverture spatiale uniforme ; (2) une Commutation dans le Domaine Fréquentiel (FDS) avec apprentissage contrastif qui effectue une commutation d'amplitude dans l'espace de Fourier pour des représentations de caractéristiques robustes. Notre cadre intègre ces composants dans une architecture enseignant-élève pour exploiter efficacement à la fois les données étiquetées et non étiquetées. Une évaluation exhaustive sur six ensembles de données ultrasonores diversifiés (ganglions lymphatiques, lésions mammaires, nodules thyroïdiens et prostate) démontre une supériorité constante par rapport aux méthodes de l'état de l'art. Avec un taux d'étiquetage de 5 %, Switch réalise des améliorations remarquables : 80,04 % de Dice sur LN-INT, 85,52 % sur DDTI et 83,48 % sur les ensembles de données Prostate, notre approche semi-supervisée dépassant même les lignes de base supervisées. La méthode maintient une efficacité paramétrique (1,8 million de paramètres) tout en offrant des performances supérieures, validant son efficacité pour les applications d'imagerie médicale à ressources limitées. Le code source est publiquement disponible à l'adresse https://github.com/jinggqu/Switch.
English
Medical ultrasound image segmentation faces significant challenges due to limited labeled data and characteristic imaging artifacts including speckle noise and low-contrast boundaries. While semi-supervised learning (SSL) approaches have emerged to address data scarcity, existing methods suffer from suboptimal unlabeled data utilization and lack robust feature representation mechanisms. In this paper, we propose Switch, a novel SSL framework with two key innovations: (1) Multiscale Switch (MSS) strategy that employs hierarchical patch mixing to achieve uniform spatial coverage; (2) Frequency Domain Switch (FDS) with contrastive learning that performs amplitude switching in Fourier space for robust feature representations. Our framework integrates these components within a teacher-student architecture to effectively leverage both labeled and unlabeled data. Comprehensive evaluation across six diverse ultrasound datasets (lymph nodes, breast lesions, thyroid nodules, and prostate) demonstrates consistent superiority over state-of-the-art methods. At 5\% labeling ratio, Switch achieves remarkable improvements: 80.04\% Dice on LN-INT, 85.52\% Dice on DDTI, and 83.48\% Dice on Prostate datasets, with our semi-supervised approach even exceeding fully supervised baselines. The method maintains parameter efficiency (1.8M parameters) while delivering superior performance, validating its effectiveness for resource-constrained medical imaging applications. The source code is publicly available at https://github.com/jinggqu/Switch