SegDT: 医療画像分割のためのDiffusion Transformerベースのモデル
SegDT: A Diffusion Transformer-Based Segmentation Model for Medical Imaging
July 21, 2025
著者: Salah Eddine Bekhouche, Gaby Maroun, Fadi Dornaika, Abdenour Hadid
cs.AI
要旨
医療画像のセグメンテーションは、疾患の診断や治療計画を含む多くの医療タスクにおいて重要です。特に、皮膚病変のセグメンテーションは、皮膚がんの診断や患者のモニタリングにおいて不可欠です。この文脈において、本論文は、拡散トランスフォーマー(DiT)に基づく新しいセグメンテーションモデルであるSegDTを紹介します。SegDTは、低コストのハードウェアで動作するように設計されており、Rectified Flowを組み込むことで、推論ステップを削減しながら生成品質を向上させ、標準的な拡散モデルの柔軟性を維持します。提案手法は、3つのベンチマークデータセットで評価され、既存のいくつかの研究と比較され、最先端の結果を達成しながら高速な推論速度を維持します。これにより、提案モデルは実世界の医療アプリケーションにおいて魅力的なものとなっています。この研究は、医療画像分析における深層学習モデルの性能と能力を向上させ、医療従事者にとってより迅速で正確な診断ツールを実現します。コードはhttps://github.com/Bekhouche/SegDT{GitHub}で公開されています。
English
Medical image segmentation is crucial for many healthcare tasks, including
disease diagnosis and treatment planning. One key area is the segmentation of
skin lesions, which is vital for diagnosing skin cancer and monitoring
patients. In this context, this paper introduces SegDT, a new segmentation
model based on diffusion transformer (DiT). SegDT is designed to work on
low-cost hardware and incorporates Rectified Flow, which improves the
generation quality at reduced inference steps and maintains the flexibility of
standard diffusion models. Our method is evaluated on three benchmarking
datasets and compared against several existing works, achieving
state-of-the-art results while maintaining fast inference speeds. This makes
the proposed model appealing for real-world medical applications. This work
advances the performance and capabilities of deep learning models in medical
image analysis, enabling faster, more accurate diagnostic tools for healthcare
professionals. The code is made publicly available at
https://github.com/Bekhouche/SegDT{GitHub}.