Um Estudo sobre o Desempenho das Modificações do U-Net na Segmentação de Tumores Retroperitoneais
A Study on the Performance of U-Net Modifications in Retroperitoneal Tumor Segmentation
February 1, 2025
Autores: Moein Heidari, Ehsan Khodapanah Aghdam, Alexander Manzella, Daniel Hsu, Rebecca Scalabrino, Wenjin Chen, David J. Foran, Ilker Hacihaliloglu
cs.AI
Resumo
O retroperitônio abriga uma variedade de tumores, incluindo tipos raros benignos e malignos, que apresentam desafios diagnósticos e de tratamento devido à sua infrequência e proximidade de estruturas vitais. Estimar o volume do tumor é difícil devido às suas formas irregulares, e a segmentação manual é demorada. A segmentação automática usando U-Net e suas variantes, incorporando elementos do Transformador de Visão (ViT), tem mostrado resultados promissores, mas enfrenta dificuldades com altas demandas computacionais. Para lidar com isso, arquiteturas como o Modelo de Espaço de Estado Mamba (SSM) e Memória Estendida de Longo e Curto Prazo (xLSTM) oferecem soluções eficientes ao lidar com dependências de longo alcance com menor consumo de recursos. Este estudo avalia melhorias na U-Net, incluindo CNN, ViT, Mamba e xLSTM, em um novo conjunto de dados de TC interno e um conjunto de dados público de segmentação de órgãos. O modelo proposto ViLU-Net integra blocos Vi para uma segmentação aprimorada. Os resultados destacam a eficiência do xLSTM no framework U-Net. O código está publicamente acessível no GitHub.
English
The retroperitoneum hosts a variety of tumors, including rare benign and
malignant types, which pose diagnostic and treatment challenges due to their
infrequency and proximity to vital structures. Estimating tumor volume is
difficult due to their irregular shapes, and manual segmentation is
time-consuming. Automatic segmentation using U-Net and its variants,
incorporating Vision Transformer (ViT) elements, has shown promising results
but struggles with high computational demands. To address this, architectures
like the Mamba State Space Model (SSM) and Extended Long-Short Term Memory
(xLSTM) offer efficient solutions by handling long-range dependencies with
lower resource consumption. This study evaluates U-Net enhancements, including
CNN, ViT, Mamba, and xLSTM, on a new in-house CT dataset and a public organ
segmentation dataset. The proposed ViLU-Net model integrates Vi-blocks for
improved segmentation. Results highlight xLSTM's efficiency in the U-Net
framework. The code is publicly accessible on GitHub.Summary
AI-Generated Summary