ChatPaper.aiChatPaper

SegDT: Трансформер на основе диффузионных моделей для сегментации медицинских изображений

SegDT: A Diffusion Transformer-Based Segmentation Model for Medical Imaging

July 21, 2025
Авторы: Salah Eddine Bekhouche, Gaby Maroun, Fadi Dornaika, Abdenour Hadid
cs.AI

Аннотация

Сегментация медицинских изображений играет ключевую роль во многих задачах здравоохранения, включая диагностику заболеваний и планирование лечения. Одним из важных направлений является сегментация кожных поражений, которая имеет решающее значение для диагностики рака кожи и мониторинга пациентов. В этом контексте данная работа представляет SegDT — новую модель сегментации, основанную на диффузионном трансформере (DiT). SegDT разработана для работы на недорогом оборудовании и включает Rectified Flow, что улучшает качество генерации при сокращении числа шагов вывода и сохраняет гибкость стандартных диффузионных моделей. Наш метод оценивается на трех эталонных наборах данных и сравнивается с несколькими существующими подходами, демонстрируя передовые результаты при сохранении высокой скорости вывода. Это делает предложенную модель привлекательной для реальных медицинских приложений. Данная работа способствует повышению производительности и возможностей моделей глубокого обучения в анализе медицинских изображений, предоставляя медицинским специалистам более быстрые и точные диагностические инструменты. Код модели доступен публично по адресу https://github.com/Bekhouche/SegDT{GitHub}.
English
Medical image segmentation is crucial for many healthcare tasks, including disease diagnosis and treatment planning. One key area is the segmentation of skin lesions, which is vital for diagnosing skin cancer and monitoring patients. In this context, this paper introduces SegDT, a new segmentation model based on diffusion transformer (DiT). SegDT is designed to work on low-cost hardware and incorporates Rectified Flow, which improves the generation quality at reduced inference steps and maintains the flexibility of standard diffusion models. Our method is evaluated on three benchmarking datasets and compared against several existing works, achieving state-of-the-art results while maintaining fast inference speeds. This makes the proposed model appealing for real-world medical applications. This work advances the performance and capabilities of deep learning models in medical image analysis, enabling faster, more accurate diagnostic tools for healthcare professionals. The code is made publicly available at https://github.com/Bekhouche/SegDT{GitHub}.
PDF42July 25, 2025