Un estudio sobre el rendimiento de las modificaciones de U-Net en la segmentación de tumores retroperitoneales
A Study on the Performance of U-Net Modifications in Retroperitoneal Tumor Segmentation
February 1, 2025
Autores: Moein Heidari, Ehsan Khodapanah Aghdam, Alexander Manzella, Daniel Hsu, Rebecca Scalabrino, Wenjin Chen, David J. Foran, Ilker Hacihaliloglu
cs.AI
Resumen
El retroperitoneo alberga una variedad de tumores, incluidos tipos benignos y malignos raros, que plantean desafíos en el diagnóstico y tratamiento debido a su infrecuencia y proximidad a estructuras vitales. Estimar el volumen del tumor es complicado debido a sus formas irregulares, y la segmentación manual es laboriosa. La segmentación automática utilizando U-Net y sus variantes, que incorporan elementos del Transformador de Visión (ViT), ha mostrado resultados prometedores pero enfrenta dificultades con altas demandas computacionales. Para abordar esto, arquitecturas como el Modelo de Espacio de Estado Mamba (SSM) y la Memoria a Largo Plazo Extendida (xLSTM) ofrecen soluciones eficientes al manejar dependencias a largo plazo con menor consumo de recursos. Este estudio evalúa mejoras de U-Net, incluyendo CNN, ViT, Mamba y xLSTM, en un nuevo conjunto de datos de TC interno y un conjunto de datos público de segmentación de órganos. El modelo propuesto ViLU-Net integra bloques Vi para una segmentación mejorada. Los resultados resaltan la eficiencia de xLSTM en el marco de U-Net. El código es accesible públicamente en GitHub.
English
The retroperitoneum hosts a variety of tumors, including rare benign and
malignant types, which pose diagnostic and treatment challenges due to their
infrequency and proximity to vital structures. Estimating tumor volume is
difficult due to their irregular shapes, and manual segmentation is
time-consuming. Automatic segmentation using U-Net and its variants,
incorporating Vision Transformer (ViT) elements, has shown promising results
but struggles with high computational demands. To address this, architectures
like the Mamba State Space Model (SSM) and Extended Long-Short Term Memory
(xLSTM) offer efficient solutions by handling long-range dependencies with
lower resource consumption. This study evaluates U-Net enhancements, including
CNN, ViT, Mamba, and xLSTM, on a new in-house CT dataset and a public organ
segmentation dataset. The proposed ViLU-Net model integrates Vi-blocks for
improved segmentation. Results highlight xLSTM's efficiency in the U-Net
framework. The code is publicly accessible on GitHub.Summary
AI-Generated Summary