Mehrskaliger Schalter für semi-überwachtes und kontrastives Lernen bei der Segmentierung medizinischer Ultraschallbilder

Zusammenfassung

Die Segmentierung medizinischer Ultraschallbilder steht vor erheblichen Herausforderungen aufgrund begrenzter annotierter Daten und charakteristischer Bildartefakte, einschließlich Speckle-Rauschen und kontrastschwacher Grenzen. Während semi-süberwachte Lernansätze (SSL) entwickelt wurden, um den Datenmangel zu bewältigen, leiden bestehende Methoden unter suboptimaler Nutzung ungelabelter Daten und fehlenden robusten Merkmalsrepräsentationsmechanismen. In dieser Arbeit stellen wir Switch vor, ein neuartiges SSL-Framework mit zwei zentralen Innovationen: (1) Eine Multiskalen-Switch (MSS)-Strategie, die hierarchisches Patch-Mixing zur gleichmäßigen räumlichen Abdeckung einsetzt; (2) Frequency Domain Switch (FDS) mit kontrastivem Lernen, das Amplitudenwechsel im Fourier-Raum für robuste Merkmalsrepräsentationen durchführt. Unser Framework integriert diese Komponenten in einer Teacher-Student-Architektur, um sowohl gelabelte als auch ungelabelte Daten effektiv zu nutzen. Eine umfassende Auswertung über sechs verschiedene Ultraschall-Datensätze (Lymphknoten, Brustläsionen, Schilddrüsenknoten und Prostata) demonstriert eine konsistente Überlegenheit gegenüber state-of-the-art Methoden. Bei einem Labeling-Anteil von 5 % erzielt Switch bemerkenswerte Verbesserungen: 80,04 % Dice auf LN-INT, 85,52 % Dice auf DDTI und 83,48 % Dice auf den Prostata-Datensätzen, wobei unser semi-süberwachter Ansatz sogar vollständig süberwachte Baseline-Methoden übertrifft. Die Methode bewahrt Parametereffizienz (1,8 Mio. Parameter) bei gleichzeitig überlegener Leistung, was ihre Wirksamkeit für ressourcenbeschränkte medizinische Bildgebungsanwendungen bestätigt. Der Quellcode ist öffentlich verfügbar unter https://github.com/jinggqu/Switch.

English

Medical ultrasound image segmentation faces significant challenges due to limited labeled data and characteristic imaging artifacts including speckle noise and low-contrast boundaries. While semi-supervised learning (SSL) approaches have emerged to address data scarcity, existing methods suffer from suboptimal unlabeled data utilization and lack robust feature representation mechanisms. In this paper, we propose Switch, a novel SSL framework with two key innovations: (1) Multiscale Switch (MSS) strategy that employs hierarchical patch mixing to achieve uniform spatial coverage; (2) Frequency Domain Switch (FDS) with contrastive learning that performs amplitude switching in Fourier space for robust feature representations. Our framework integrates these components within a teacher-student architecture to effectively leverage both labeled and unlabeled data. Comprehensive evaluation across six diverse ultrasound datasets (lymph nodes, breast lesions, thyroid nodules, and prostate) demonstrates consistent superiority over state-of-the-art methods. At 5\% labeling ratio, Switch achieves remarkable improvements: 80.04\% Dice on LN-INT, 85.52\% Dice on DDTI, and 83.48\% Dice on Prostate datasets, with our semi-supervised approach even exceeding fully supervised baselines. The method maintains parameter efficiency (1.8M parameters) while delivering superior performance, validating its effectiveness for resource-constrained medical imaging applications. The source code is publicly available at https://github.com/jinggqu/Switch

Mehrskaliger Schalter für semi-überwachtes und kontrastives Lernen bei der Segmentierung medizinischer Ultraschallbilder

Multiscale Switch for Semi-Supervised and Contrastive Learning in Medical Ultrasound Image Segmentation

Zusammenfassung

Support