SPARSE-Daten, reiche Ergebnisse: Few-Shot Semi-Supervised Learning durch klassenbedingte Bildübersetzung
SPARSE Data, Rich Results: Few-Shot Semi-Supervised Learning via Class-Conditioned Image Translation
August 8, 2025
papers.authors: Guido Manni, Clemente Lauretti, Loredana Zollo, Paolo Soda
cs.AI
papers.abstract
Deep Learning hat die medizinische Bildgebung revolutioniert, doch seine Effektivität wird stark durch unzureichend gelabelte Trainingsdaten eingeschränkt. Dieses Papier stellt ein neuartiges, GAN-basiertes semi-supervidiertes Lernframework vor, das speziell für Szenarien mit geringen Mengen an gelabelten Daten entwickelt wurde und in Umgebungen mit 5 bis 50 gelabelten Proben pro Klasse evaluiert wird. Unser Ansatz integriert drei spezialisierte neuronale Netze – einen Generator für klassenbedingte Bildübersetzung, einen Diskriminator zur Authentizitätsbewertung und Klassifizierung sowie einen dedizierten Klassifikator – innerhalb eines dreiphasigen Trainingsframeworks. Die Methode wechselt zwischen supervidiertem Training auf begrenzten gelabelten Daten und unüberwachtem Lernen, das reichlich ungelabelte Bilder durch Bild-zu-Bild-Übersetzung anstelle der Generierung aus Rauschen nutzt. Wir verwenden Ensemble-basiertes Pseudo-Labeling, das konfidenzgewichtete Vorhersagen des Diskriminators und Klassifikators mit zeitlicher Konsistenz durch exponentiell gleitende Mittelung kombiniert, um zuverlässige Label-Schätzungen für ungelabelte Daten zu ermöglichen. Eine umfassende Evaluierung über elf MedMNIST-Datensätze zeigt, dass unser Ansatz statistisch signifikante Verbesserungen gegenüber sechs state-of-the-art GAN-basierten semi-supervidierten Methoden erzielt, mit besonders starker Leistung im extremen 5-Shot-Setting, wo die Knappheit an gelabelten Daten am herausforderndsten ist. Das Framework behält seine Überlegenheit in allen evaluierten Settings (5, 10, 20 und 50 Shots pro Klasse) bei. Unser Ansatz bietet eine praktische Lösung für Anwendungen in der medizinischen Bildgebung, bei denen die Kosten für Annotationen prohibitiv sind, und ermöglicht robuste Klassifizierungsleistungen selbst bei minimalen gelabelten Daten. Der Code ist verfügbar unter https://github.com/GuidoManni/SPARSE.
English
Deep learning has revolutionized medical imaging, but its effectiveness is
severely limited by insufficient labeled training data. This paper introduces a
novel GAN-based semi-supervised learning framework specifically designed for
low labeled-data regimes, evaluated across settings with 5 to 50 labeled
samples per class. Our approach integrates three specialized neural networks --
a generator for class-conditioned image translation, a discriminator for
authenticity assessment and classification, and a dedicated classifier --
within a three-phase training framework. The method alternates between
supervised training on limited labeled data and unsupervised learning that
leverages abundant unlabeled images through image-to-image translation rather
than generation from noise. We employ ensemble-based pseudo-labeling that
combines confidence-weighted predictions from the discriminator and classifier
with temporal consistency through exponential moving averaging, enabling
reliable label estimation for unlabeled data. Comprehensive evaluation across
eleven MedMNIST datasets demonstrates that our approach achieves statistically
significant improvements over six state-of-the-art GAN-based semi-supervised
methods, with particularly strong performance in the extreme 5-shot setting
where the scarcity of labeled data is most challenging. The framework maintains
its superiority across all evaluated settings (5, 10, 20, and 50 shots per
class). Our approach offers a practical solution for medical imaging
applications where annotation costs are prohibitive, enabling robust
classification performance even with minimal labeled data. Code is available at
https://github.com/GuidoManni/SPARSE.