ChatPaper.aiChatPaper

Dados ESCASSOS, Resultados Ricos: Aprendizado Semi-Supervisionado com Poucos Exemplos via Tradução de Imagens Condicionada por Classe

SPARSE Data, Rich Results: Few-Shot Semi-Supervised Learning via Class-Conditioned Image Translation

August 8, 2025
Autores: Guido Manni, Clemente Lauretti, Loredana Zollo, Paolo Soda
cs.AI

Resumo

O aprendizado profundo revolucionou a imagem médica, mas sua eficácia é severamente limitada pela insuficiência de dados de treinamento rotulados. Este artigo introduz uma nova estrutura de aprendizado semi-supervisionado baseada em GAN, projetada especificamente para regimes com poucos dados rotulados, avaliada em configurações com 5 a 50 amostras rotuladas por classe. Nossa abordagem integra três redes neurais especializadas — um gerador para tradução de imagens condicionada por classe, um discriminador para avaliação de autenticidade e classificação, e um classificador dedicado — dentro de uma estrutura de treinamento em três fases. O método alterna entre treinamento supervisionado com dados rotulados limitados e aprendizado não supervisionado que aproveita imagens não rotuladas abundantes por meio de tradução de imagem para imagem, em vez de geração a partir de ruído. Empregamos pseudo-rotulação baseada em ensemble que combina previsões ponderadas por confiança do discriminador e do classificador com consistência temporal por meio de média móvel exponencial, permitindo uma estimativa confiável de rótulos para dados não rotulados. A avaliação abrangente em onze conjuntos de dados MedMNIST demonstra que nossa abordagem alcança melhorias estatisticamente significativas em relação a seis métodos semi-supervisionados baseados em GAN de última geração, com desempenho particularmente forte na configuração extrema de 5 exemplos, onde a escassez de dados rotulados é mais desafiadora. A estrutura mantém sua superioridade em todas as configurações avaliadas (5, 10, 20 e 50 exemplos por classe). Nossa abordagem oferece uma solução prática para aplicações de imagem médica onde os custos de anotação são proibitivos, permitindo um desempenho de classificação robusto mesmo com dados rotulados mínimos. O código está disponível em https://github.com/GuidoManni/SPARSE.
English
Deep learning has revolutionized medical imaging, but its effectiveness is severely limited by insufficient labeled training data. This paper introduces a novel GAN-based semi-supervised learning framework specifically designed for low labeled-data regimes, evaluated across settings with 5 to 50 labeled samples per class. Our approach integrates three specialized neural networks -- a generator for class-conditioned image translation, a discriminator for authenticity assessment and classification, and a dedicated classifier -- within a three-phase training framework. The method alternates between supervised training on limited labeled data and unsupervised learning that leverages abundant unlabeled images through image-to-image translation rather than generation from noise. We employ ensemble-based pseudo-labeling that combines confidence-weighted predictions from the discriminator and classifier with temporal consistency through exponential moving averaging, enabling reliable label estimation for unlabeled data. Comprehensive evaluation across eleven MedMNIST datasets demonstrates that our approach achieves statistically significant improvements over six state-of-the-art GAN-based semi-supervised methods, with particularly strong performance in the extreme 5-shot setting where the scarcity of labeled data is most challenging. The framework maintains its superiority across all evaluated settings (5, 10, 20, and 50 shots per class). Our approach offers a practical solution for medical imaging applications where annotation costs are prohibitive, enabling robust classification performance even with minimal labeled data. Code is available at https://github.com/GuidoManni/SPARSE.
PDF22August 18, 2025