MediAug: Исследование визуальных методов аугментации в медицинской визуализации
MediAug: Exploring Visual Augmentation in Medical Imaging
April 26, 2025
Авторы: Xuyin Qi, Zeyu Zhang, Canxuan Gang, Hao Zhang, Lei Zhang, Zhiwei Zhang, Yang Zhao
cs.AI
Аннотация
Аугментация данных играет ключевую роль в медицинской визуализации для повышения точности классификации, обнаружения поражений и сегментации органов в условиях ограниченного объема данных. Однако остаются две значительные проблемы. Во-первых, заметный разрыв между доменами естественных фотографий и медицинских изображений может искажать важные признаки заболеваний. Во-вторых, исследования по аугментации в медицинской визуализации фрагментированы и ограничены отдельными задачами или архитектурами, что оставляет преимущества современных стратегий, основанных на смешивании, неясными. Для решения этих проблем мы предлагаем унифицированную систему оценки с шестью методами аугментации, основанными на смешивании, интегрированными с архитектурами на основе сверточных сетей и трансформеров, на наборах данных МРТ опухолей мозга и изображений глазного дна при заболеваниях глаз. Наш вклад трехчастный. (1) Мы представляем MediAug — всеобъемлющий и воспроизводимый бенчмарк для продвинутой аугментации данных в медицинской визуализации. (2) Мы систематически оцениваем MixUp, YOCO, CropMix, CutMix, AugMix и SnapMix с архитектурами ResNet-50 и ViT-B. (3) Мы демонстрируем в ходе обширных экспериментов, что MixUp обеспечивает наибольшее улучшение в задаче классификации опухолей мозга для ResNet-50 с точностью 79,19%, а SnapMix — для ViT-B с точностью 99,44%, и что YOCO дает наибольшее улучшение в задаче классификации заболеваний глаз для ResNet-50 с точностью 91,60%, а CutMix — для ViT-B с точностью 97,94%. Код будет доступен по адресу https://github.com/AIGeeksGroup/MediAug.
English
Data augmentation is essential in medical imaging for improving
classification accuracy, lesion detection, and organ segmentation under limited
data conditions. However, two significant challenges remain. First, a
pronounced domain gap between natural photographs and medical images can
distort critical disease features. Second, augmentation studies in medical
imaging are fragmented and limited to single tasks or architectures, leaving
the benefits of advanced mix-based strategies unclear. To address these
challenges, we propose a unified evaluation framework with six mix-based
augmentation methods integrated with both convolutional and transformer
backbones on brain tumour MRI and eye disease fundus datasets. Our
contributions are threefold. (1) We introduce MediAug, a comprehensive and
reproducible benchmark for advanced data augmentation in medical imaging. (2)
We systematically evaluate MixUp, YOCO, CropMix, CutMix, AugMix, and SnapMix
with ResNet-50 and ViT-B backbones. (3) We demonstrate through extensive
experiments that MixUp yields the greatest improvement on the brain tumor
classification task for ResNet-50 with 79.19% accuracy and SnapMix yields the
greatest improvement for ViT-B with 99.44% accuracy, and that YOCO yields the
greatest improvement on the eye disease classification task for ResNet-50 with
91.60% accuracy and CutMix yields the greatest improvement for ViT-B with
97.94% accuracy. Code will be available at
https://github.com/AIGeeksGroup/MediAug.Summary
AI-Generated Summary