Исследование производительности модификаций U-Net в сегментации опухолей в ретроперитонеуме
A Study on the Performance of U-Net Modifications in Retroperitoneal Tumor Segmentation
February 1, 2025
Авторы: Moein Heidari, Ehsan Khodapanah Aghdam, Alexander Manzella, Daniel Hsu, Rebecca Scalabrino, Wenjin Chen, David J. Foran, Ilker Hacihaliloglu
cs.AI
Аннотация
Ретроперитонеальная область является местом обитания различных опухолей, включая редкие доброкачественные и злокачественные типы, которые представляют диагностические и терапевтические вызовы из-за их редкости и близости к важным структурам. Оценка объема опухоли затруднена из-за их неправильных форм, а ручная сегментация занимает много времени. Автоматическая сегментация с использованием U-Net и его вариантов, включая элементы Vision Transformer (ViT), продемонстрировала многообещающие результаты, но сталкивается с высокими вычислительными требованиями. Для решения этой проблемы архитектуры, такие как Mamba State Space Model (SSM) и Extended Long-Short Term Memory (xLSTM), предлагают эффективные решения, обрабатывая долгосрочные зависимости с более низким потреблением ресурсов. В данном исследовании оцениваются улучшения U-Net, включая CNN, ViT, Mamba и xLSTM, на новом внутреннем наборе данных CT и общедоступном наборе данных сегментации органов. Предложенная модель ViLU-Net интегрирует Vi-блоки для улучшенной сегментации. Результаты подчеркивают эффективность xLSTM в рамках U-Net. Код общедоступен на GitHub.
English
The retroperitoneum hosts a variety of tumors, including rare benign and
malignant types, which pose diagnostic and treatment challenges due to their
infrequency and proximity to vital structures. Estimating tumor volume is
difficult due to their irregular shapes, and manual segmentation is
time-consuming. Automatic segmentation using U-Net and its variants,
incorporating Vision Transformer (ViT) elements, has shown promising results
but struggles with high computational demands. To address this, architectures
like the Mamba State Space Model (SSM) and Extended Long-Short Term Memory
(xLSTM) offer efficient solutions by handling long-range dependencies with
lower resource consumption. This study evaluates U-Net enhancements, including
CNN, ViT, Mamba, and xLSTM, on a new in-house CT dataset and a public organ
segmentation dataset. The proposed ViLU-Net model integrates Vi-blocks for
improved segmentation. Results highlight xLSTM's efficiency in the U-Net
framework. The code is publicly accessible on GitHub.Summary
AI-Generated Summary