IMA++: Conjunto de Datos de Segmentación de Lesiones Cutáneas Dermoscópicas del Archivo ISIC con Múltiples Anotadores
IMA++: ISIC Archive Multi-Annotator Dermoscopic Skin Lesion Segmentation Dataset
December 25, 2025
Autores: Kumar Abhishek, Jeremy Kawahara, Ghassan Hamarneh
cs.AI
Resumen
La segmentación de imágenes médicas con múltiples anotadores es un problema de investigación importante, pero requiere conjuntos de datos anotados que son costosos de recopilar. La imagen dermatoscópica de lesiones cutáneas permite a expertos humanos y sistemas de IA observar estructuras morfológicas que de otro modo no serían discernibles en fotografías clínicas regulares. Sin embargo, actualmente no existen conjuntos de datos de segmentación de lesiones cutáneas (SLC) con múltiples anotadores, a gran escala y de acceso público, que incluyan las anotaciones individuales para imágenes dermatoscópicas de lesiones cutáneas. Presentamos ISIC MultiAnnot++, un conjunto de datos público y extenso de segmentación de lesiones cutáneas con múltiples anotadores para imágenes del Archivo ISIC. El conjunto de datos final contiene 17.684 máscaras de segmentación que abarcan 14.967 imágenes dermatoscópicas, donde 2.394 imágenes dermatoscópicas tienen entre 2 y 5 segmentaciones por imagen, lo que lo convierte en el conjunto de datos de SLC público más grande disponible. Además, se incluyen metadatos sobre la segmentación, como el nivel de habilidad de los anotadores y la herramienta de segmentación utilizada, lo que permite investigar temas como el modelado de preferencias específicas del anotador para la segmentación y el análisis de metadatos del anotador. Proporcionamos un análisis de las características de este conjunto de datos, particiones de datos curadas y máscaras de segmentación por consenso.
English
Multi-annotator medical image segmentation is an important research problem, but requires annotated datasets that are expensive to collect. Dermoscopic skin lesion imaging allows human experts and AI systems to observe morphological structures otherwise not discernable from regular clinical photographs. However, currently there are no large-scale publicly available multi-annotator skin lesion segmentation (SLS) datasets with annotator-labels for dermoscopic skin lesion imaging. We introduce ISIC MultiAnnot++, a large public multi-annotator skin lesion segmentation dataset for images from the ISIC Archive. The final dataset contains 17,684 segmentation masks spanning 14,967 dermoscopic images, where 2,394 dermoscopic images have 2-5 segmentations per image, making it the largest publicly available SLS dataset. Further, metadata about the segmentation, including the annotators' skill level and segmentation tool, is included, enabling research on topics such as annotator-specific preference modeling for segmentation and annotator metadata analysis. We provide an analysis on the characteristics of this dataset, curated data partitions, and consensus segmentation masks.