MediAug: Erforschung visueller Augmentation in der medizinischen Bildgebung
MediAug: Exploring Visual Augmentation in Medical Imaging
April 26, 2025
Autoren: Xuyin Qi, Zeyu Zhang, Canxuan Gang, Hao Zhang, Lei Zhang, Zhiwei Zhang, Yang Zhao
cs.AI
Zusammenfassung
Datenaugmentierung ist in der medizinischen Bildgebung entscheidend, um die Klassifikationsgenauigkeit, die Läsionserkennung und die Organsegmentierung unter begrenzten Datenbedingungen zu verbessern. Es bleiben jedoch zwei wesentliche Herausforderungen bestehen. Erstens kann eine deutliche Domänenlücke zwischen natürlichen Fotografien und medizinischen Bildern kritische Krankheitsmerkmale verzerren. Zweitens sind Augmentierungsstudien in der medizinischen Bildgebung fragmentiert und auf einzelne Aufgaben oder Architekturen beschränkt, wodurch die Vorteile fortschrittlicher mix-basierter Strategien unklar bleiben. Um diese Herausforderungen zu bewältigen, schlagen wir ein einheitliches Bewertungsframework mit sechs mix-basierten Augmentierungsmethoden vor, die sowohl mit konvolutionellen als auch mit Transformer-Backbones auf MRT-Datensätzen von Hirntumoren und Fundus-Datensätzen von Augenerkrankungen integriert sind. Unsere Beiträge sind dreifach. (1) Wir führen MediAug ein, einen umfassenden und reproduzierbaren Benchmark für fortschrittliche Datenaugmentierung in der medizinischen Bildgebung. (2) Wir bewerten systematisch MixUp, YOCO, CropMix, CutMix, AugMix und SnapMix mit ResNet-50- und ViT-B-Backbones. (3) Wir zeigen durch umfangreiche Experimente, dass MixUp die größte Verbesserung bei der Klassifikation von Hirntumoren für ResNet-50 mit einer Genauigkeit von 79,19 % erzielt und SnapMix die größte Verbesserung für ViT-B mit einer Genauigkeit von 99,44 % liefert, während YOCO die größte Verbesserung bei der Klassifikation von Augenerkrankungen für ResNet-50 mit einer Genauigkeit von 91,60 % erzielt und CutMix die größte Verbesserung für ViT-B mit einer Genauigkeit von 97,94 % liefert. Der Code wird unter https://github.com/AIGeeksGroup/MediAug verfügbar sein.
English
Data augmentation is essential in medical imaging for improving
classification accuracy, lesion detection, and organ segmentation under limited
data conditions. However, two significant challenges remain. First, a
pronounced domain gap between natural photographs and medical images can
distort critical disease features. Second, augmentation studies in medical
imaging are fragmented and limited to single tasks or architectures, leaving
the benefits of advanced mix-based strategies unclear. To address these
challenges, we propose a unified evaluation framework with six mix-based
augmentation methods integrated with both convolutional and transformer
backbones on brain tumour MRI and eye disease fundus datasets. Our
contributions are threefold. (1) We introduce MediAug, a comprehensive and
reproducible benchmark for advanced data augmentation in medical imaging. (2)
We systematically evaluate MixUp, YOCO, CropMix, CutMix, AugMix, and SnapMix
with ResNet-50 and ViT-B backbones. (3) We demonstrate through extensive
experiments that MixUp yields the greatest improvement on the brain tumor
classification task for ResNet-50 with 79.19% accuracy and SnapMix yields the
greatest improvement for ViT-B with 99.44% accuracy, and that YOCO yields the
greatest improvement on the eye disease classification task for ResNet-50 with
91.60% accuracy and CutMix yields the greatest improvement for ViT-B with
97.94% accuracy. Code will be available at
https://github.com/AIGeeksGroup/MediAug.Summary
AI-Generated Summary