ChatPaper.aiChatPaper

SegDT: Um Modelo de Segmentação Baseado em Transformadores de Difusão para Imagens Médicas

SegDT: A Diffusion Transformer-Based Segmentation Model for Medical Imaging

July 21, 2025
Autores: Salah Eddine Bekhouche, Gaby Maroun, Fadi Dornaika, Abdenour Hadid
cs.AI

Resumo

A segmentação de imagens médicas é crucial para muitas tarefas na área da saúde, incluindo o diagnóstico de doenças e o planejamento de tratamentos. Uma área-chave é a segmentação de lesões de pele, que é vital para o diagnóstico de câncer de pele e o monitoramento de pacientes. Nesse contexto, este artigo apresenta o SegDT, um novo modelo de segmentação baseado em transformadores de difusão (DiT). O SegDT foi projetado para funcionar em hardware de baixo custo e incorpora o Fluxo Retificado, que melhora a qualidade da geração com etapas de inferência reduzidas e mantém a flexibilidade dos modelos de difusão padrão. Nosso método é avaliado em três conjuntos de dados de referência e comparado com vários trabalhos existentes, alcançando resultados de ponta enquanto mantém velocidades de inferência rápidas. Isso torna o modelo proposto atraente para aplicações médicas no mundo real. Este trabalho avança o desempenho e as capacidades dos modelos de aprendizado profundo na análise de imagens médicas, permitindo ferramentas de diagnóstico mais rápidas e precisas para profissionais da saúde. O código está disponível publicamente em https://github.com/Bekhouche/SegDT{GitHub}.
English
Medical image segmentation is crucial for many healthcare tasks, including disease diagnosis and treatment planning. One key area is the segmentation of skin lesions, which is vital for diagnosing skin cancer and monitoring patients. In this context, this paper introduces SegDT, a new segmentation model based on diffusion transformer (DiT). SegDT is designed to work on low-cost hardware and incorporates Rectified Flow, which improves the generation quality at reduced inference steps and maintains the flexibility of standard diffusion models. Our method is evaluated on three benchmarking datasets and compared against several existing works, achieving state-of-the-art results while maintaining fast inference speeds. This makes the proposed model appealing for real-world medical applications. This work advances the performance and capabilities of deep learning models in medical image analysis, enabling faster, more accurate diagnostic tools for healthcare professionals. The code is made publicly available at https://github.com/Bekhouche/SegDT{GitHub}.
PDF42July 25, 2025