ChatPaper.aiChatPaper

Datos ESCASOS, Resultados Ricos: Aprendizaje Semi-Supervisado con Pocos Ejemplos mediante Traducción de Imágenes Condicionada por Clase

SPARSE Data, Rich Results: Few-Shot Semi-Supervised Learning via Class-Conditioned Image Translation

August 8, 2025
Autores: Guido Manni, Clemente Lauretti, Loredana Zollo, Paolo Soda
cs.AI

Resumen

El aprendizaje profundo ha revolucionado la imagen médica, pero su efectividad se ve severamente limitada por la insuficiencia de datos etiquetados para el entrenamiento. Este artículo presenta un novedoso marco de aprendizaje semi-supervisado basado en GAN, específicamente diseñado para regímenes con pocos datos etiquetados, evaluado en configuraciones que van de 5 a 50 muestras etiquetadas por clase. Nuestro enfoque integra tres redes neuronales especializadas: un generador para la traducción de imágenes condicionada por clase, un discriminador para la evaluación de autenticidad y clasificación, y un clasificador dedicado, dentro de un marco de entrenamiento de tres fases. El método alterna entre el entrenamiento supervisado con datos etiquetados limitados y el aprendizaje no supervisado que aprovecha la abundancia de imágenes no etiquetadas mediante la traducción de imagen a imagen en lugar de la generación a partir de ruido. Empleamos etiquetado pseudo-supervisado basado en ensambles que combina predicciones ponderadas por confianza del discriminador y el clasificador con consistencia temporal a través de promedios móviles exponenciales, permitiendo una estimación confiable de etiquetas para datos no etiquetados. Una evaluación exhaustiva en once conjuntos de datos MedMNIST demuestra que nuestro enfoque logra mejoras estadísticamente significativas sobre seis métodos semi-supervisados basados en GAN de última generación, con un rendimiento particularmente fuerte en el escenario extremo de 5 muestras, donde la escasez de datos etiquetados es más desafiante. El marco mantiene su superioridad en todas las configuraciones evaluadas (5, 10, 20 y 50 muestras por clase). Nuestro enfoque ofrece una solución práctica para aplicaciones de imagen médica donde los costos de anotación son prohibitivos, permitiendo un rendimiento de clasificación robusto incluso con datos etiquetados mínimos. El código está disponible en https://github.com/GuidoManni/SPARSE.
English
Deep learning has revolutionized medical imaging, but its effectiveness is severely limited by insufficient labeled training data. This paper introduces a novel GAN-based semi-supervised learning framework specifically designed for low labeled-data regimes, evaluated across settings with 5 to 50 labeled samples per class. Our approach integrates three specialized neural networks -- a generator for class-conditioned image translation, a discriminator for authenticity assessment and classification, and a dedicated classifier -- within a three-phase training framework. The method alternates between supervised training on limited labeled data and unsupervised learning that leverages abundant unlabeled images through image-to-image translation rather than generation from noise. We employ ensemble-based pseudo-labeling that combines confidence-weighted predictions from the discriminator and classifier with temporal consistency through exponential moving averaging, enabling reliable label estimation for unlabeled data. Comprehensive evaluation across eleven MedMNIST datasets demonstrates that our approach achieves statistically significant improvements over six state-of-the-art GAN-based semi-supervised methods, with particularly strong performance in the extreme 5-shot setting where the scarcity of labeled data is most challenging. The framework maintains its superiority across all evaluated settings (5, 10, 20, and 50 shots per class). Our approach offers a practical solution for medical imaging applications where annotation costs are prohibitive, enabling robust classification performance even with minimal labeled data. Code is available at https://github.com/GuidoManni/SPARSE.
PDF22August 18, 2025