MediAug: 医療画像における視覚的拡張の探求
MediAug: Exploring Visual Augmentation in Medical Imaging
April 26, 2025
著者: Xuyin Qi, Zeyu Zhang, Canxuan Gang, Hao Zhang, Lei Zhang, Zhiwei Zhang, Yang Zhao
cs.AI
要旨
データ拡張は、限られたデータ条件下での分類精度、病変検出、臓器セグメンテーションの向上において、医療画像処理において不可欠です。しかし、2つの重要な課題が残されています。第一に、自然写真と医療画像の間の顕著なドメインギャップが、重要な疾患特徴を歪める可能性があります。第二に、医療画像における拡張研究は断片的で、単一のタスクやアーキテクチャに限定されており、高度なミックスベース戦略の利点が不明確です。これらの課題に対処するため、脳腫瘍MRIと眼疾患眼底データセットにおいて、畳み込みおよびトランスフォーマーバックボーンと統合された6つのミックスベース拡張手法を用いた統一評価フレームワークを提案します。我々の貢献は3つあります。(1)医療画像における高度なデータ拡張のための包括的かつ再現可能なベンチマークであるMediAugを導入します。(2)ResNet-50とViT-Bバックボーンを用いて、MixUp、YOCO、CropMix、CutMix、AugMix、SnapMixを体系的に評価します。(3)広範な実験を通じて、MixUpがResNet-50の脳腫瘍分類タスクで79.19%の精度で最大の改善をもたらし、SnapMixがViT-Bで99.44%の精度で最大の改善をもたらすこと、またYOCOがResNet-50の眼疾患分類タスクで91.60%の精度で最大の改善をもたらし、CutMixがViT-Bで97.94%の精度で最大の改善をもたらすことを示します。コードはhttps://github.com/AIGeeksGroup/MediAugで公開予定です。
English
Data augmentation is essential in medical imaging for improving
classification accuracy, lesion detection, and organ segmentation under limited
data conditions. However, two significant challenges remain. First, a
pronounced domain gap between natural photographs and medical images can
distort critical disease features. Second, augmentation studies in medical
imaging are fragmented and limited to single tasks or architectures, leaving
the benefits of advanced mix-based strategies unclear. To address these
challenges, we propose a unified evaluation framework with six mix-based
augmentation methods integrated with both convolutional and transformer
backbones on brain tumour MRI and eye disease fundus datasets. Our
contributions are threefold. (1) We introduce MediAug, a comprehensive and
reproducible benchmark for advanced data augmentation in medical imaging. (2)
We systematically evaluate MixUp, YOCO, CropMix, CutMix, AugMix, and SnapMix
with ResNet-50 and ViT-B backbones. (3) We demonstrate through extensive
experiments that MixUp yields the greatest improvement on the brain tumor
classification task for ResNet-50 with 79.19% accuracy and SnapMix yields the
greatest improvement for ViT-B with 99.44% accuracy, and that YOCO yields the
greatest improvement on the eye disease classification task for ResNet-50 with
91.60% accuracy and CutMix yields the greatest improvement for ViT-B with
97.94% accuracy. Code will be available at
https://github.com/AIGeeksGroup/MediAug.Summary
AI-Generated Summary