SegDT: Ein auf Diffusionstransformern basierendes Segmentierungsmodell für die medizinische Bildgebung
SegDT: A Diffusion Transformer-Based Segmentation Model for Medical Imaging
July 21, 2025
papers.authors: Salah Eddine Bekhouche, Gaby Maroun, Fadi Dornaika, Abdenour Hadid
cs.AI
papers.abstract
Die Segmentierung medizinischer Bilder ist entscheidend für viele Aufgaben im Gesundheitswesen, einschließlich der Diagnose von Krankheiten und der Planung von Behandlungen. Ein zentraler Bereich ist die Segmentierung von Hautläsionen, die für die Diagnose von Hautkrebs und die Überwachung von Patienten von entscheidender Bedeutung ist. In diesem Zusammenhang stellt dieses Papier SegDT vor, ein neues Segmentierungsmodell, das auf einem Diffusion Transformer (DiT) basiert. SegDT ist darauf ausgelegt, auf kostengünstiger Hardware zu arbeiten und integriert Rectified Flow, was die Generierungsqualität bei reduzierten Inferenzschritten verbessert und die Flexibilität standardmäßiger Diffusionsmodelle beibehält. Unsere Methode wird auf drei Benchmark-Datensätzen evaluiert und mit mehreren bestehenden Arbeiten verglichen, wobei sie state-of-the-art Ergebnisse erzielt und gleichzeitig schnelle Inferenzgeschwindigkeiten beibehält. Dies macht das vorgeschlagene Modell für reale medizinische Anwendungen attraktiv. Diese Arbeit verbessert die Leistung und Fähigkeiten von Deep-Learning-Modellen in der medizinischen Bildanalyse und ermöglicht schnellere, genauere Diagnosewerkzeuge für medizinisches Fachpersonal. Der Code ist öffentlich verfügbar unter https://github.com/Bekhouche/SegDT{GitHub}.
English
Medical image segmentation is crucial for many healthcare tasks, including
disease diagnosis and treatment planning. One key area is the segmentation of
skin lesions, which is vital for diagnosing skin cancer and monitoring
patients. In this context, this paper introduces SegDT, a new segmentation
model based on diffusion transformer (DiT). SegDT is designed to work on
low-cost hardware and incorporates Rectified Flow, which improves the
generation quality at reduced inference steps and maintains the flexibility of
standard diffusion models. Our method is evaluated on three benchmarking
datasets and compared against several existing works, achieving
state-of-the-art results while maintaining fast inference speeds. This makes
the proposed model appealing for real-world medical applications. This work
advances the performance and capabilities of deep learning models in medical
image analysis, enabling faster, more accurate diagnostic tools for healthcare
professionals. The code is made publicly available at
https://github.com/Bekhouche/SegDT{GitHub}.