IMA++: Conjunto de Dados de Segmentação de Lesões Cutâneas Dermatoscópicas com Múltiplos Anotadores do ISIC Archive
IMA++: ISIC Archive Multi-Annotator Dermoscopic Skin Lesion Segmentation Dataset
December 25, 2025
Autores: Kumar Abhishek, Jeremy Kawahara, Ghassan Hamarneh
cs.AI
Resumo
A segmentação de imagens médicas com múltiplos anotadores é um problema de pesquisa importante, mas requer conjuntos de dados anotados que são dispendiosos para coletar. A imagem dermatoscópica de lesões cutâneas permite que especialistas humanos e sistemas de IA observem estruturas morfológicas que de outra forma não seriam discerníveis em fotografias clínicas regulares. No entanto, atualmente não existem conjuntos de dados de segmentação de lesões cutâneas (SLC) com múltiplos anotadores, em grande escala e publicamente disponíveis, com anotações individuais para imagens dermatoscópicas de lesões cutâneas. Apresentamos o ISIC MultiAnnot++, um grande conjunto de dados público de segmentação de lesões cutâneas com múltiplos anotadores para imagens do Arquivo ISIC. O conjunto de dados final contém 17.684 máscaras de segmentação abrangendo 14.967 imagens dermatoscópicas, onde 2.394 imagens dermatoscópicas possuem entre 2 a 5 segmentações por imagem, tornando-o o maior conjunto de dados de SLC publicamente disponível. Adicionalmente, metadados sobre a segmentação, incluindo o nível de habilidade dos anotadores e a ferramenta de segmentação utilizada, estão incluídos, permitindo pesquisas sobre tópicos como a modelagem de preferências específicas do anotador para segmentação e a análise de metadados do anotador. Fornecemos uma análise sobre as características deste conjunto de dados, partições de dados curadas e máscaras de segmentação de consenso.
English
Multi-annotator medical image segmentation is an important research problem, but requires annotated datasets that are expensive to collect. Dermoscopic skin lesion imaging allows human experts and AI systems to observe morphological structures otherwise not discernable from regular clinical photographs. However, currently there are no large-scale publicly available multi-annotator skin lesion segmentation (SLS) datasets with annotator-labels for dermoscopic skin lesion imaging. We introduce ISIC MultiAnnot++, a large public multi-annotator skin lesion segmentation dataset for images from the ISIC Archive. The final dataset contains 17,684 segmentation masks spanning 14,967 dermoscopic images, where 2,394 dermoscopic images have 2-5 segmentations per image, making it the largest publicly available SLS dataset. Further, metadata about the segmentation, including the annotators' skill level and segmentation tool, is included, enabling research on topics such as annotator-specific preference modeling for segmentation and annotator metadata analysis. We provide an analysis on the characteristics of this dataset, curated data partitions, and consensus segmentation masks.