IAUNet: U-Net con Conciencia de Instancias
IAUNet: Instance-Aware U-Net
August 3, 2025
Autores: Yaroslav Prytula, Illia Tsiporenko, Ali Zeynalli, Dmytro Fishman
cs.AI
Resumen
La segmentación de instancias es fundamental en la imagen biomédica para distinguir con precisión objetos individuales como células, que a menudo se superponen y varían en tamaño. Los métodos recientes basados en consultas, donde las consultas de objetos guían la segmentación, han mostrado un rendimiento sólido. Si bien U-Net ha sido una arquitectura de referencia en la segmentación de imágenes médicas, su potencial en enfoques basados en consultas sigue siendo en gran parte inexplorado. En este trabajo, presentamos IAUNet, una novedosa arquitectura U-Net basada en consultas. El diseño central incluye una arquitectura U-Net completa, mejorada por un nuevo decodificador de píxeles convolucional ligero, lo que hace que el modelo sea más eficiente y reduce el número de parámetros. Además, proponemos un decodificador Transformer que refina las características específicas de los objetos a través de múltiples escalas. Finalmente, presentamos el Conjunto de Datos de Segmentación Completa de Células Revvity 2025, un recurso único con anotaciones detalladas del citoplasma de células superpuestas en imágenes de campo claro, estableciendo un nuevo estándar para la segmentación de instancias biomédicas. Los experimentos en múltiples conjuntos de datos públicos y en el nuestro muestran que IAUNet supera a la mayoría de los modelos más avanzados completamente convolucionales, basados en transformers, basados en consultas y específicos para la segmentación de células, estableciendo una línea base sólida para tareas de segmentación de instancias celulares. El código está disponible en https://github.com/SlavkoPrytula/IAUNet.
English
Instance segmentation is critical in biomedical imaging to accurately
distinguish individual objects like cells, which often overlap and vary in
size. Recent query-based methods, where object queries guide segmentation, have
shown strong performance. While U-Net has been a go-to architecture in medical
image segmentation, its potential in query-based approaches remains largely
unexplored. In this work, we present IAUNet, a novel query-based U-Net
architecture. The core design features a full U-Net architecture, enhanced by a
novel lightweight convolutional Pixel decoder, making the model more efficient
and reducing the number of parameters. Additionally, we propose a Transformer
decoder that refines object-specific features across multiple scales. Finally,
we introduce the 2025 Revvity Full Cell Segmentation Dataset, a unique resource
with detailed annotations of overlapping cell cytoplasm in brightfield images,
setting a new benchmark for biomedical instance segmentation. Experiments on
multiple public datasets and our own show that IAUNet outperforms most
state-of-the-art fully convolutional, transformer-based, and query-based models
and cell segmentation-specific models, setting a strong baseline for cell
instance segmentation tasks. Code is available at
https://github.com/SlavkoPrytula/IAUNet