ChatPaper.aiChatPaper

SegDT: Een op diffusie-transformers gebaseerd segmentatiemodel voor medische beeldvorming

SegDT: A Diffusion Transformer-Based Segmentation Model for Medical Imaging

July 21, 2025
Auteurs: Salah Eddine Bekhouche, Gaby Maroun, Fadi Dornaika, Abdenour Hadid
cs.AI

Samenvatting

Medische beeldsegmentatie is cruciaal voor veel gezondheidszorgtaken, waaronder ziekte-diagnose en behandelplanning. Een belangrijk gebied is de segmentatie van huidlaesies, wat essentieel is voor het diagnosticeren van huidkanker en het monitoren van patiënten. In deze context introduceert dit artikel SegDT, een nieuw segmentatiemodel gebaseerd op de diffusion transformer (DiT). SegDT is ontworpen om te werken op hardware met lage kosten en integreert Rectified Flow, wat de generatiekwaliteit verbetert bij verminderde inferentiestappen en de flexibiliteit van standaard diffusiemodellen behoudt. Onze methode wordt geëvalueerd op drie benchmarkdatasets en vergeleken met verschillende bestaande werken, waarbij state-of-the-art resultaten worden behaald terwijl snelle inferentiesnelheden worden gehandhaafd. Dit maakt het voorgestelde model aantrekkelijk voor real-world medische toepassingen. Dit werk bevordert de prestaties en mogelijkheden van deep learning-modellen in medische beeldanalyse, waardoor snellere en nauwkeurigere diagnostische tools worden mogelijk gemaakt voor zorgprofessionals. De code is publiekelijk beschikbaar gemaakt op https://github.com/Bekhouche/SegDT{GitHub}.
English
Medical image segmentation is crucial for many healthcare tasks, including disease diagnosis and treatment planning. One key area is the segmentation of skin lesions, which is vital for diagnosing skin cancer and monitoring patients. In this context, this paper introduces SegDT, a new segmentation model based on diffusion transformer (DiT). SegDT is designed to work on low-cost hardware and incorporates Rectified Flow, which improves the generation quality at reduced inference steps and maintains the flexibility of standard diffusion models. Our method is evaluated on three benchmarking datasets and compared against several existing works, achieving state-of-the-art results while maintaining fast inference speeds. This makes the proposed model appealing for real-world medical applications. This work advances the performance and capabilities of deep learning models in medical image analysis, enabling faster, more accurate diagnostic tools for healthcare professionals. The code is made publicly available at https://github.com/Bekhouche/SegDT{GitHub}.
PDF42July 25, 2025