ChatPaper.aiChatPaper

SegDT : Un modèle de segmentation basé sur un transformateur à diffusion pour l'imagerie médicale

SegDT: A Diffusion Transformer-Based Segmentation Model for Medical Imaging

July 21, 2025
papers.authors: Salah Eddine Bekhouche, Gaby Maroun, Fadi Dornaika, Abdenour Hadid
cs.AI

papers.abstract

La segmentation d'images médicales est cruciale pour de nombreuses tâches de santé, notamment le diagnostic de maladies et la planification des traitements. Un domaine clé est la segmentation des lésions cutanées, essentielle pour diagnostiquer le cancer de la peau et suivre les patients. Dans ce contexte, cet article présente SegDT, un nouveau modèle de segmentation basé sur un transformateur de diffusion (DiT). SegDT est conçu pour fonctionner sur du matériel à faible coût et intègre Rectified Flow, ce qui améliore la qualité de génération avec un nombre réduit d'étapes d'inférence tout en conservant la flexibilité des modèles de diffusion standard. Notre méthode est évaluée sur trois ensembles de données de référence et comparée à plusieurs travaux existants, obtenant des résultats de pointe tout en maintenant des vitesses d'inférence rapides. Cela rend le modèle proposé attrayant pour des applications médicales en conditions réelles. Ce travail améliore les performances et les capacités des modèles d'apprentissage profond dans l'analyse d'images médicales, permettant des outils de diagnostic plus rapides et plus précis pour les professionnels de santé. Le code est rendu public à l'adresse suivante : https://github.com/Bekhouche/SegDT{GitHub}.
English
Medical image segmentation is crucial for many healthcare tasks, including disease diagnosis and treatment planning. One key area is the segmentation of skin lesions, which is vital for diagnosing skin cancer and monitoring patients. In this context, this paper introduces SegDT, a new segmentation model based on diffusion transformer (DiT). SegDT is designed to work on low-cost hardware and incorporates Rectified Flow, which improves the generation quality at reduced inference steps and maintains the flexibility of standard diffusion models. Our method is evaluated on three benchmarking datasets and compared against several existing works, achieving state-of-the-art results while maintaining fast inference speeds. This makes the proposed model appealing for real-world medical applications. This work advances the performance and capabilities of deep learning models in medical image analysis, enabling faster, more accurate diagnostic tools for healthcare professionals. The code is made publicly available at https://github.com/Bekhouche/SegDT{GitHub}.
PDF42July 25, 2025