MediAug: Esplorazione delle tecniche di aumento visivo nell'imaging medico
MediAug: Exploring Visual Augmentation in Medical Imaging
April 26, 2025
Autori: Xuyin Qi, Zeyu Zhang, Canxuan Gang, Hao Zhang, Lei Zhang, Zhiwei Zhang, Yang Zhao
cs.AI
Abstract
L'aumento dei dati è essenziale nell'imaging medico per migliorare l'accuratezza della classificazione, il rilevamento delle lesioni e la segmentazione degli organi in condizioni di dati limitati. Tuttavia, rimangono due sfide significative. In primo luogo, un marcato divario di dominio tra le fotografie naturali e le immagini mediche può distorcere le caratteristiche critiche delle malattie. In secondo luogo, gli studi sull'aumento dei dati nell'imaging medico sono frammentati e limitati a singoli compiti o architetture, lasciando incerti i benefici delle strategie avanzate basate su mix. Per affrontare queste sfide, proponiamo un framework di valutazione unificato con sei metodi di aumento basati su mix integrati con backbone sia convoluzionali che transformer su dataset di risonanza magnetica per tumori cerebrali e di fondo oculare per malattie degli occhi. I nostri contributi sono tre. (1) Introduciamo MediAug, un benchmark completo e riproducibile per l'aumento avanzato dei dati nell'imaging medico. (2) Valutiamo sistematicamente MixUp, YOCO, CropMix, CutMix, AugMix e SnapMix con backbone ResNet-50 e ViT-B. (3) Dimostriamo attraverso esperimenti estesi che MixUp produce il miglioramento maggiore nel compito di classificazione dei tumori cerebrali per ResNet-50 con un'accuratezza del 79,19% e SnapMix produce il miglioramento maggiore per ViT-B con un'accuratezza del 99,44%, e che YOCO produce il miglioramento maggiore nel compito di classificazione delle malattie degli occhi per ResNet-50 con un'accuratezza del 91,60% e CutMix produce il miglioramento maggiore per ViT-B con un'accuratezza del 97,94%. Il codice sarà disponibile su https://github.com/AIGeeksGroup/MediAug.
English
Data augmentation is essential in medical imaging for improving
classification accuracy, lesion detection, and organ segmentation under limited
data conditions. However, two significant challenges remain. First, a
pronounced domain gap between natural photographs and medical images can
distort critical disease features. Second, augmentation studies in medical
imaging are fragmented and limited to single tasks or architectures, leaving
the benefits of advanced mix-based strategies unclear. To address these
challenges, we propose a unified evaluation framework with six mix-based
augmentation methods integrated with both convolutional and transformer
backbones on brain tumour MRI and eye disease fundus datasets. Our
contributions are threefold. (1) We introduce MediAug, a comprehensive and
reproducible benchmark for advanced data augmentation in medical imaging. (2)
We systematically evaluate MixUp, YOCO, CropMix, CutMix, AugMix, and SnapMix
with ResNet-50 and ViT-B backbones. (3) We demonstrate through extensive
experiments that MixUp yields the greatest improvement on the brain tumor
classification task for ResNet-50 with 79.19% accuracy and SnapMix yields the
greatest improvement for ViT-B with 99.44% accuracy, and that YOCO yields the
greatest improvement on the eye disease classification task for ResNet-50 with
91.60% accuracy and CutMix yields the greatest improvement for ViT-B with
97.94% accuracy. Code will be available at
https://github.com/AIGeeksGroup/MediAug.