Eine Studie zur Leistungsfähigkeit von U-Net Modifikationen bei der Segmentierung retroperitonealer Tumore
A Study on the Performance of U-Net Modifications in Retroperitoneal Tumor Segmentation
February 1, 2025
Autoren: Moein Heidari, Ehsan Khodapanah Aghdam, Alexander Manzella, Daniel Hsu, Rebecca Scalabrino, Wenjin Chen, David J. Foran, Ilker Hacihaliloglu
cs.AI
Zusammenfassung
Das Retroperitoneum beherbergt eine Vielzahl von Tumoren, darunter seltene gutartige und bösartige Arten, die aufgrund ihrer Seltenheit und der Nähe zu lebenswichtigen Strukturen diagnostische und therapeutische Herausforderungen darstellen. Die Schätzung des Tumorvolumens ist aufgrund ihrer unregelmäßigen Formen schwierig, und die manuelle Segmentierung ist zeitaufwändig. Die automatische Segmentierung unter Verwendung von U-Net und seinen Varianten, die Vision Transformer (ViT)-Elemente integrieren, hat vielversprechende Ergebnisse gezeigt, kämpft jedoch mit hohen Rechenanforderungen. Um dies zu bewältigen, bieten Architekturen wie das Mamba State Space Model (SSM) und das Extended Long-Short Term Memory (xLSTM) effiziente Lösungen, indem sie langreichweitige Abhängigkeiten mit geringerem Ressourcenverbrauch handhaben. Diese Studie bewertet U-Net-Verbesserungen, einschließlich CNN, ViT, Mamba und xLSTM, an einem neuen hauseigenen CT-Datensatz und einem öffentlichen Organsegmentierungsdatensatz. Das vorgeschlagene ViLU-Net-Modell integriert Vi-Blöcke für eine verbesserte Segmentierung. Die Ergebnisse heben die Effizienz von xLSTM im U-Net-Framework hervor. Der Code ist öffentlich auf GitHub zugänglich.
English
The retroperitoneum hosts a variety of tumors, including rare benign and
malignant types, which pose diagnostic and treatment challenges due to their
infrequency and proximity to vital structures. Estimating tumor volume is
difficult due to their irregular shapes, and manual segmentation is
time-consuming. Automatic segmentation using U-Net and its variants,
incorporating Vision Transformer (ViT) elements, has shown promising results
but struggles with high computational demands. To address this, architectures
like the Mamba State Space Model (SSM) and Extended Long-Short Term Memory
(xLSTM) offer efficient solutions by handling long-range dependencies with
lower resource consumption. This study evaluates U-Net enhancements, including
CNN, ViT, Mamba, and xLSTM, on a new in-house CT dataset and a public organ
segmentation dataset. The proposed ViLU-Net model integrates Vi-blocks for
improved segmentation. Results highlight xLSTM's efficiency in the U-Net
framework. The code is publicly accessible on GitHub.Summary
AI-Generated Summary