Medical SAM 2: Segmentación de imágenes médicas como video a través de Segment Anything Modelo 2Medical SAM 2: Segment medical images as video via Segment Anything
Model 2
En este documento, presentamos Medical SAM 2 (MedSAM-2), un modelo avanzado de segmentación que utiliza el marco SAM 2 para abordar tareas de segmentación de imágenes médicas en 2D y 3D. Al adoptar la filosofía de considerar las imágenes médicas como videos, MedSAM-2 no solo se aplica a imágenes médicas en 3D, sino que también desbloquea una nueva capacidad de Segmentación de Una Sola Pista. Esto permite a los usuarios proporcionar una pista para solo una imagen específica, apuntando a un objeto, después de lo cual el modelo puede segmentar de manera autónoma el mismo tipo de objeto en todas las imágenes subsiguientes, independientemente de las relaciones temporales entre las imágenes. Evaluamos MedSAM-2 en una variedad de modalidades de imágenes médicas, incluidos órganos abdominales, discos ópticos, tumores cerebrales, nódulos tiroideos y lesiones cutáneas, comparándolo con modelos de vanguardia tanto en configuraciones de segmentación tradicionales como interactivas. Nuestros hallazgos muestran que MedSAM-2 no solo supera a los modelos existentes en rendimiento, sino que también exhibe una generalización superior en una variedad de tareas de segmentación de imágenes médicas. Nuestro código se publicará en: https://github.com/MedicineToken/Medical-SAM2