Uno studio sulle prestazioni delle modifiche a U-Net nella segmentazione dei tumori retroperitoneali
A Study on the Performance of U-Net Modifications in Retroperitoneal Tumor Segmentation
February 1, 2025
Autori: Moein Heidari, Ehsan Khodapanah Aghdam, Alexander Manzella, Daniel Hsu, Rebecca Scalabrino, Wenjin Chen, David J. Foran, Ilker Hacihaliloglu
cs.AI
Abstract
Il retroperitoneo ospita una varietà di tumori, tra cui tipi rari benigni e maligni, che presentano sfide diagnostiche e di trattamento a causa della loro scarsa frequenza e della vicinanza a strutture vitali. Stimare il volume del tumore è difficile a causa delle loro forme irregolari e la segmentazione manuale è dispendiosa in termini di tempo. La segmentazione automatica utilizzando U-Net e le sue varianti, che incorporano elementi del Vision Transformer (ViT), ha mostrato risultati promettenti ma fatica con elevate richieste computazionali. Per affrontare questo problema, architetture come il Modello dello Spazio di Stato Mamba (SSM) e la Memoria a Lungo e Corto Termine Estesa (xLSTM) offrono soluzioni efficienti gestendo dipendenze a lungo raggio con minor consumo di risorse. Questo studio valuta miglioramenti a U-Net, inclusi CNN, ViT, Mamba e xLSTM, su un nuovo dataset CT interno e un dataset pubblico di segmentazione degli organi. Il modello proposto ViLU-Net integra blocchi Vi per una segmentazione migliorata. I risultati evidenziano l'efficienza di xLSTM nel framework U-Net. Il codice è accessibile pubblicamente su GitHub.
English
The retroperitoneum hosts a variety of tumors, including rare benign and
malignant types, which pose diagnostic and treatment challenges due to their
infrequency and proximity to vital structures. Estimating tumor volume is
difficult due to their irregular shapes, and manual segmentation is
time-consuming. Automatic segmentation using U-Net and its variants,
incorporating Vision Transformer (ViT) elements, has shown promising results
but struggles with high computational demands. To address this, architectures
like the Mamba State Space Model (SSM) and Extended Long-Short Term Memory
(xLSTM) offer efficient solutions by handling long-range dependencies with
lower resource consumption. This study evaluates U-Net enhancements, including
CNN, ViT, Mamba, and xLSTM, on a new in-house CT dataset and a public organ
segmentation dataset. The proposed ViLU-Net model integrates Vi-blocks for
improved segmentation. Results highlight xLSTM's efficiency in the U-Net
framework. The code is publicly accessible on GitHub.Summary
AI-Generated Summary