IMA++: ISIC-Archiv Multi-Annotator-Dermoskopie-Datensatz zur Segmentierung von Hautläsionen
IMA++: ISIC Archive Multi-Annotator Dermoscopic Skin Lesion Segmentation Dataset
December 25, 2025
papers.authors: Kumar Abhishek, Jeremy Kawahara, Ghassan Hamarneh
cs.AI
papers.abstract
Die Segmentierung medizinischer Bilder durch mehrere Annotatoren ist ein wichtiges Forschungsproblem, erfordert jedoch annotierte Datensätze, deren Erstellung kostspielig ist. Die dermoskopische Bildgebung von Hautläsionen ermöglicht es menschlichen Experten und KI-Systemen, morphologische Strukturen zu erkennen, die in gewöhnlichen klinischen Fotografien nicht sichtbar wären. Allerdings gibt es derzeit keine groß angelegten, öffentlich verfügbaren Multi-Annotator-Segmentierungsdatensätze für Hautläsionen (SLS) mit Annotator-Labels für dermoskopische Hautläsionenbilder. Wir stellen ISIC MultiAnnot++ vor, einen großen öffentlichen Multi-Annotator-Segmentierungsdatensatz für Hautläsionen mit Bildern aus dem ISIC-Archiv. Der endgültige Datensatz umfasst 17.684 Segmentierungsmasken, die sich auf 14.967 dermoskopische Bilder verteilen, wobei 2.394 dermoskopische Bilder 2–5 Segmentierungen pro Bild aufweisen. Dies macht ihn zum größten öffentlich verfügbaren SLS-Datensatz. Darüber hinaus sind Metadaten zur Segmentierung enthalten, einschließlich des Kenntnisstands der Annotatoren und des verwendeten Segmentierungswerkzeugs, was Forschung zu Themen wie annotatorspezifischer Präferenzmodellierung für Segmentierungen und der Analyse von Annotator-Metadaten ermöglicht. Wir liefern eine Analyse der Merkmale dieses Datensatzes, kuratierte Datenpartitionen und konsensbasierte Segmentierungsmasken.
English
Multi-annotator medical image segmentation is an important research problem, but requires annotated datasets that are expensive to collect. Dermoscopic skin lesion imaging allows human experts and AI systems to observe morphological structures otherwise not discernable from regular clinical photographs. However, currently there are no large-scale publicly available multi-annotator skin lesion segmentation (SLS) datasets with annotator-labels for dermoscopic skin lesion imaging. We introduce ISIC MultiAnnot++, a large public multi-annotator skin lesion segmentation dataset for images from the ISIC Archive. The final dataset contains 17,684 segmentation masks spanning 14,967 dermoscopic images, where 2,394 dermoscopic images have 2-5 segmentations per image, making it the largest publicly available SLS dataset. Further, metadata about the segmentation, including the annotators' skill level and segmentation tool, is included, enabling research on topics such as annotator-specific preference modeling for segmentation and annotator metadata analysis. We provide an analysis on the characteristics of this dataset, curated data partitions, and consensus segmentation masks.