MediAug : Exploration des augmentations visuelles en imagerie médicale
MediAug: Exploring Visual Augmentation in Medical Imaging
April 26, 2025
Auteurs: Xuyin Qi, Zeyu Zhang, Canxuan Gang, Hao Zhang, Lei Zhang, Zhiwei Zhang, Yang Zhao
cs.AI
Résumé
L'augmentation de données est essentielle en imagerie médicale pour améliorer la précision de la classification, la détection des lésions et la segmentation des organes dans des conditions de données limitées. Cependant, deux défis majeurs persistent. Premièrement, un écart de domaine marqué entre les photographies naturelles et les images médicales peut déformer les caractéristiques critiques des maladies. Deuxièmement, les études sur l'augmentation en imagerie médicale sont fragmentées et limitées à des tâches ou architectures uniques, laissant les avantages des stratégies avancées basées sur le mélange incertains. Pour relever ces défis, nous proposons un cadre d'évaluation unifié avec six méthodes d'augmentation basées sur le mélange, intégrées à des architectures convolutives et transformateurs, sur des ensembles de données d'IRM de tumeurs cérébrales et de fond d'œil pour les maladies oculaires. Nos contributions sont triples. (1) Nous introduisons MediAug, un benchmark complet et reproductible pour l'augmentation avancée de données en imagerie médicale. (2) Nous évaluons systématiquement MixUp, YOCO, CropMix, CutMix, AugMix et SnapMix avec les architectures ResNet-50 et ViT-B. (3) Nous démontrons par des expériences approfondies que MixUp apporte la plus grande amélioration pour la tâche de classification des tumeurs cérébrales avec ResNet-50, atteignant une précision de 79,19 %, et que SnapMix apporte la plus grande amélioration pour ViT-B avec une précision de 99,44 %. De plus, YOCO apporte la plus grande amélioration pour la tâche de classification des maladies oculaires avec ResNet-50, atteignant une précision de 91,60 %, et CutMix apporte la plus grande amélioration pour ViT-B avec une précision de 97,94 %. Le code sera disponible à l'adresse https://github.com/AIGeeksGroup/MediAug.
English
Data augmentation is essential in medical imaging for improving
classification accuracy, lesion detection, and organ segmentation under limited
data conditions. However, two significant challenges remain. First, a
pronounced domain gap between natural photographs and medical images can
distort critical disease features. Second, augmentation studies in medical
imaging are fragmented and limited to single tasks or architectures, leaving
the benefits of advanced mix-based strategies unclear. To address these
challenges, we propose a unified evaluation framework with six mix-based
augmentation methods integrated with both convolutional and transformer
backbones on brain tumour MRI and eye disease fundus datasets. Our
contributions are threefold. (1) We introduce MediAug, a comprehensive and
reproducible benchmark for advanced data augmentation in medical imaging. (2)
We systematically evaluate MixUp, YOCO, CropMix, CutMix, AugMix, and SnapMix
with ResNet-50 and ViT-B backbones. (3) We demonstrate through extensive
experiments that MixUp yields the greatest improvement on the brain tumor
classification task for ResNet-50 with 79.19% accuracy and SnapMix yields the
greatest improvement for ViT-B with 99.44% accuracy, and that YOCO yields the
greatest improvement on the eye disease classification task for ResNet-50 with
91.60% accuracy and CutMix yields the greatest improvement for ViT-B with
97.94% accuracy. Code will be available at
https://github.com/AIGeeksGroup/MediAug.Summary
AI-Generated Summary