MediAug: Explorando a Aumentação Visual em Imagens Médicas
MediAug: Exploring Visual Augmentation in Medical Imaging
April 26, 2025
Autores: Xuyin Qi, Zeyu Zhang, Canxuan Gang, Hao Zhang, Lei Zhang, Zhiwei Zhang, Yang Zhao
cs.AI
Resumo
Aumento de dados é essencial em imagens médicas para melhorar a precisão de classificação, detecção de lesões e segmentação de órgãos em condições de dados limitados. No entanto, dois desafios significativos permanecem. Primeiro, uma lacuna de domínio pronunciada entre fotografias naturais e imagens médicas pode distorcer características críticas de doenças. Segundo, estudos de aumento em imagens médicas são fragmentados e limitados a tarefas ou arquiteturas únicas, deixando os benefícios de estratégias avançadas baseadas em mistura pouco claros. Para abordar esses desafios, propomos um framework de avaliação unificado com seis métodos de aumento baseados em mistura integrados a backbones tanto convolucionais quanto de transformadores em conjuntos de dados de ressonância magnética de tumores cerebrais e fundo de olho para doenças oculares. Nossas contribuições são três. (1) Introduzimos o MediAug, um benchmark abrangente e reproduzível para aumento avançado de dados em imagens médicas. (2) Avaliamos sistematicamente MixUp, YOCO, CropMix, CutMix, AugMix e SnapMix com backbones ResNet-50 e ViT-B. (3) Demonstramos através de extensos experimentos que o MixUp proporciona a maior melhoria na tarefa de classificação de tumores cerebrais para o ResNet-50 com 79,19% de precisão e o SnapMix proporciona a maior melhoria para o ViT-B com 99,44% de precisão, e que o YOCO proporciona a maior melhoria na tarefa de classificação de doenças oculares para o ResNet-50 com 91,60% de precisão e o CutMix proporciona a maior melhoria para o ViT-B com 97,94% de precisão. O código estará disponível em https://github.com/AIGeeksGroup/MediAug.
English
Data augmentation is essential in medical imaging for improving
classification accuracy, lesion detection, and organ segmentation under limited
data conditions. However, two significant challenges remain. First, a
pronounced domain gap between natural photographs and medical images can
distort critical disease features. Second, augmentation studies in medical
imaging are fragmented and limited to single tasks or architectures, leaving
the benefits of advanced mix-based strategies unclear. To address these
challenges, we propose a unified evaluation framework with six mix-based
augmentation methods integrated with both convolutional and transformer
backbones on brain tumour MRI and eye disease fundus datasets. Our
contributions are threefold. (1) We introduce MediAug, a comprehensive and
reproducible benchmark for advanced data augmentation in medical imaging. (2)
We systematically evaluate MixUp, YOCO, CropMix, CutMix, AugMix, and SnapMix
with ResNet-50 and ViT-B backbones. (3) We demonstrate through extensive
experiments that MixUp yields the greatest improvement on the brain tumor
classification task for ResNet-50 with 79.19% accuracy and SnapMix yields the
greatest improvement for ViT-B with 99.44% accuracy, and that YOCO yields the
greatest improvement on the eye disease classification task for ResNet-50 with
91.60% accuracy and CutMix yields the greatest improvement for ViT-B with
97.94% accuracy. Code will be available at
https://github.com/AIGeeksGroup/MediAug.