MediAug: Exploración de la Aumentación Visual en Imágenes Médicas
MediAug: Exploring Visual Augmentation in Medical Imaging
April 26, 2025
Autores: Xuyin Qi, Zeyu Zhang, Canxuan Gang, Hao Zhang, Lei Zhang, Zhiwei Zhang, Yang Zhao
cs.AI
Resumen
El aumento de datos es esencial en imágenes médicas para mejorar la precisión en la clasificación, la detección de lesiones y la segmentación de órganos en condiciones de datos limitados. Sin embargo, persisten dos desafíos significativos. Primero, una brecha de dominio pronunciada entre fotografías naturales e imágenes médicas puede distorsionar características críticas de las enfermedades. Segundo, los estudios de aumento en imágenes médicas están fragmentados y limitados a tareas o arquitecturas individuales, dejando poco claros los beneficios de las estrategias avanzadas basadas en mezclas. Para abordar estos desafíos, proponemos un marco de evaluación unificado con seis métodos de aumento basados en mezclas, integrados tanto con arquitecturas convolucionales como con transformadores, en conjuntos de datos de resonancia magnética de tumores cerebrales y fondos de ojo de enfermedades oculares. Nuestras contribuciones son tres. (1) Presentamos MediAug, un punto de referencia completo y reproducible para el aumento avanzado de datos en imágenes médicas. (2) Evaluamos sistemáticamente MixUp, YOCO, CropMix, CutMix, AugMix y SnapMix con arquitecturas ResNet-50 y ViT-B. (3) Demostramos mediante experimentos extensos que MixUp produce la mayor mejora en la tarea de clasificación de tumores cerebrales para ResNet-50 con un 79.19% de precisión y SnapMix produce la mayor mejora para ViT-B con un 99.44% de precisión, mientras que YOCO produce la mayor mejora en la tarea de clasificación de enfermedades oculares para ResNet-50 con un 91.60% de precisión y CutMix produce la mayor mejora para ViT-B con un 97.94% de precisión. El código estará disponible en https://github.com/AIGeeksGroup/MediAug.
English
Data augmentation is essential in medical imaging for improving
classification accuracy, lesion detection, and organ segmentation under limited
data conditions. However, two significant challenges remain. First, a
pronounced domain gap between natural photographs and medical images can
distort critical disease features. Second, augmentation studies in medical
imaging are fragmented and limited to single tasks or architectures, leaving
the benefits of advanced mix-based strategies unclear. To address these
challenges, we propose a unified evaluation framework with six mix-based
augmentation methods integrated with both convolutional and transformer
backbones on brain tumour MRI and eye disease fundus datasets. Our
contributions are threefold. (1) We introduce MediAug, a comprehensive and
reproducible benchmark for advanced data augmentation in medical imaging. (2)
We systematically evaluate MixUp, YOCO, CropMix, CutMix, AugMix, and SnapMix
with ResNet-50 and ViT-B backbones. (3) We demonstrate through extensive
experiments that MixUp yields the greatest improvement on the brain tumor
classification task for ResNet-50 with 79.19% accuracy and SnapMix yields the
greatest improvement for ViT-B with 99.44% accuracy, and that YOCO yields the
greatest improvement on the eye disease classification task for ResNet-50 with
91.60% accuracy and CutMix yields the greatest improvement for ViT-B with
97.94% accuracy. Code will be available at
https://github.com/AIGeeksGroup/MediAug.Summary
AI-Generated Summary