ChatPaper.aiChatPaper

SegDT: Un modello di segmentazione basato su Transformer a diffusione per l'imaging medico

SegDT: A Diffusion Transformer-Based Segmentation Model for Medical Imaging

July 21, 2025
Autori: Salah Eddine Bekhouche, Gaby Maroun, Fadi Dornaika, Abdenour Hadid
cs.AI

Abstract

La segmentazione delle immagini mediche è cruciale per molte attività sanitarie, tra cui la diagnosi delle malattie e la pianificazione dei trattamenti. Un'area chiave è la segmentazione delle lesioni cutanee, essenziale per diagnosticare il cancro della pelle e monitorare i pazienti. In questo contesto, questo articolo introduce SegDT, un nuovo modello di segmentazione basato sul diffusion transformer (DiT). SegDT è progettato per funzionare su hardware a basso costo e incorpora il Rectified Flow, che migliora la qualità della generazione riducendo i passaggi di inferenza e mantenendo la flessibilità dei modelli di diffusione standard. Il nostro metodo è valutato su tre dataset di benchmark e confrontato con diversi lavori esistenti, raggiungendo risultati all'avanguardia pur mantenendo velocità di inferenza elevate. Ciò rende il modello proposto interessante per applicazioni mediche nel mondo reale. Questo lavoro migliora le prestazioni e le capacità dei modelli di deep learning nell'analisi delle immagini mediche, consentendo strumenti diagnostici più rapidi e accurati per i professionisti sanitari. Il codice è reso disponibile pubblicamente su https://github.com/Bekhouche/SegDT{GitHub}.
English
Medical image segmentation is crucial for many healthcare tasks, including disease diagnosis and treatment planning. One key area is the segmentation of skin lesions, which is vital for diagnosing skin cancer and monitoring patients. In this context, this paper introduces SegDT, a new segmentation model based on diffusion transformer (DiT). SegDT is designed to work on low-cost hardware and incorporates Rectified Flow, which improves the generation quality at reduced inference steps and maintains the flexibility of standard diffusion models. Our method is evaluated on three benchmarking datasets and compared against several existing works, achieving state-of-the-art results while maintaining fast inference speeds. This makes the proposed model appealing for real-world medical applications. This work advances the performance and capabilities of deep learning models in medical image analysis, enabling faster, more accurate diagnostic tools for healthcare professionals. The code is made publicly available at https://github.com/Bekhouche/SegDT{GitHub}.
PDF42July 25, 2025