SPARSE Data, Rijke Resultaten: Few-Shot Semi-Supervised Learning via Klasse-geconditioneerde Beeldvertaling
SPARSE Data, Rich Results: Few-Shot Semi-Supervised Learning via Class-Conditioned Image Translation
August 8, 2025
Auteurs: Guido Manni, Clemente Lauretti, Loredana Zollo, Paolo Soda
cs.AI
Samenvatting
Deep learning heeft een revolutie teweeggebracht in medische beeldvorming, maar de effectiviteit ervan wordt ernstig beperkt door onvoldoende gelabelde trainingsdata. Dit artikel introduceert een nieuw GAN-gebaseerd semi-supervised learning framework dat specifiek is ontworpen voor situaties met weinig gelabelde data, geëvalueerd in settings met 5 tot 50 gelabelde samples per klasse. Onze aanpak integreert drie gespecialiseerde neurale netwerken -- een generator voor klasse-geconditioneerde beeldvertaling, een discriminator voor authenticiteitsbeoordeling en classificatie, en een toegewijde classifier -- binnen een driedelig trainingsframework. De methode wisselt af tussen supervised training op beperkte gelabelde data en unsupervised learning dat gebruikmaakt van overvloedige ongelabelde afbeeldingen via beeld-naar-beeldvertaling in plaats van generatie vanuit ruis. We gebruiken ensemble-gebaseerde pseudo-labeling die vertrouwensgewogen voorspellingen van de discriminator en classifier combineert met temporele consistentie door exponentiële voortschrijdende gemiddelden, wat betrouwbare labelestimatie voor ongelabelde data mogelijk maakt. Een uitgebreide evaluatie over elf MedMNIST datasets toont aan dat onze aanpak statistisch significante verbeteringen bereikt ten opzichte van zes state-of-the-art GAN-gebaseerde semi-supervised methoden, met bijzonder sterke prestaties in de extreme 5-shot setting waar de schaarste aan gelabelde data het meest uitdagend is. Het framework behoudt zijn superioriteit in alle geëvalueerde settings (5, 10, 20 en 50 shots per klasse). Onze aanpak biedt een praktische oplossing voor medische beeldvormingstoepassingen waar annotatiekosten prohibitief zijn, waardoor robuuste classificatieprestaties mogelijk zijn zelfs met minimale gelabelde data. Code is beschikbaar op https://github.com/GuidoManni/SPARSE.
English
Deep learning has revolutionized medical imaging, but its effectiveness is
severely limited by insufficient labeled training data. This paper introduces a
novel GAN-based semi-supervised learning framework specifically designed for
low labeled-data regimes, evaluated across settings with 5 to 50 labeled
samples per class. Our approach integrates three specialized neural networks --
a generator for class-conditioned image translation, a discriminator for
authenticity assessment and classification, and a dedicated classifier --
within a three-phase training framework. The method alternates between
supervised training on limited labeled data and unsupervised learning that
leverages abundant unlabeled images through image-to-image translation rather
than generation from noise. We employ ensemble-based pseudo-labeling that
combines confidence-weighted predictions from the discriminator and classifier
with temporal consistency through exponential moving averaging, enabling
reliable label estimation for unlabeled data. Comprehensive evaluation across
eleven MedMNIST datasets demonstrates that our approach achieves statistically
significant improvements over six state-of-the-art GAN-based semi-supervised
methods, with particularly strong performance in the extreme 5-shot setting
where the scarcity of labeled data is most challenging. The framework maintains
its superiority across all evaluated settings (5, 10, 20, and 50 shots per
class). Our approach offers a practical solution for medical imaging
applications where annotation costs are prohibitive, enabling robust
classification performance even with minimal labeled data. Code is available at
https://github.com/GuidoManni/SPARSE.