SPARSE-Daten, reiche Ergebnisse: Few-Shot Semi-Supervised Learning durch klassenbedingte Bildübersetzung

papers.abstract

Deep Learning hat die medizinische Bildgebung revolutioniert, doch seine Effektivität wird stark durch unzureichend gelabelte Trainingsdaten eingeschränkt. Dieses Papier stellt ein neuartiges, GAN-basiertes semi-supervidiertes Lernframework vor, das speziell für Szenarien mit geringen Mengen an gelabelten Daten entwickelt wurde und in Umgebungen mit 5 bis 50 gelabelten Proben pro Klasse evaluiert wird. Unser Ansatz integriert drei spezialisierte neuronale Netze – einen Generator für klassenbedingte Bildübersetzung, einen Diskriminator zur Authentizitätsbewertung und Klassifizierung sowie einen dedizierten Klassifikator – innerhalb eines dreiphasigen Trainingsframeworks. Die Methode wechselt zwischen supervidiertem Training auf begrenzten gelabelten Daten und unüberwachtem Lernen, das reichlich ungelabelte Bilder durch Bild-zu-Bild-Übersetzung anstelle der Generierung aus Rauschen nutzt. Wir verwenden Ensemble-basiertes Pseudo-Labeling, das konfidenzgewichtete Vorhersagen des Diskriminators und Klassifikators mit zeitlicher Konsistenz durch exponentiell gleitende Mittelung kombiniert, um zuverlässige Label-Schätzungen für ungelabelte Daten zu ermöglichen. Eine umfassende Evaluierung über elf MedMNIST-Datensätze zeigt, dass unser Ansatz statistisch signifikante Verbesserungen gegenüber sechs state-of-the-art GAN-basierten semi-supervidierten Methoden erzielt, mit besonders starker Leistung im extremen 5-Shot-Setting, wo die Knappheit an gelabelten Daten am herausforderndsten ist. Das Framework behält seine Überlegenheit in allen evaluierten Settings (5, 10, 20 und 50 Shots pro Klasse) bei. Unser Ansatz bietet eine praktische Lösung für Anwendungen in der medizinischen Bildgebung, bei denen die Kosten für Annotationen prohibitiv sind, und ermöglicht robuste Klassifizierungsleistungen selbst bei minimalen gelabelten Daten. Der Code ist verfügbar unter https://github.com/GuidoManni/SPARSE.

English

Deep learning has revolutionized medical imaging, but its effectiveness is severely limited by insufficient labeled training data. This paper introduces a novel GAN-based semi-supervised learning framework specifically designed for low labeled-data regimes, evaluated across settings with 5 to 50 labeled samples per class. Our approach integrates three specialized neural networks -- a generator for class-conditioned image translation, a discriminator for authenticity assessment and classification, and a dedicated classifier -- within a three-phase training framework. The method alternates between supervised training on limited labeled data and unsupervised learning that leverages abundant unlabeled images through image-to-image translation rather than generation from noise. We employ ensemble-based pseudo-labeling that combines confidence-weighted predictions from the discriminator and classifier with temporal consistency through exponential moving averaging, enabling reliable label estimation for unlabeled data. Comprehensive evaluation across eleven MedMNIST datasets demonstrates that our approach achieves statistically significant improvements over six state-of-the-art GAN-based semi-supervised methods, with particularly strong performance in the extreme 5-shot setting where the scarcity of labeled data is most challenging. The framework maintains its superiority across all evaluated settings (5, 10, 20, and 50 shots per class). Our approach offers a practical solution for medical imaging applications where annotation costs are prohibitive, enabling robust classification performance even with minimal labeled data. Code is available at https://github.com/GuidoManni/SPARSE.

SPARSE-Daten, reiche Ergebnisse: Few-Shot Semi-Supervised Learning durch klassenbedingte Bildübersetzung

SPARSE Data, Rich Results: Few-Shot Semi-Supervised Learning via Class-Conditioned Image Translation

papers.abstract

Support