IMA++ : Base de données de segmentation dermoscopique de lésions cutanées avec annotations multiples de l'archive ISIC
IMA++: ISIC Archive Multi-Annotator Dermoscopic Skin Lesion Segmentation Dataset
December 25, 2025
papers.authors: Kumar Abhishek, Jeremy Kawahara, Ghassan Hamarneh
cs.AI
papers.abstract
La segmentation d'images médicales par annotateurs multiples est un problème de recherche important, mais nécessite des ensembles de données annotées dont la collecte est coûteuse. L'imagerie dermatoscopique des lésions cutanées permet aux experts humains et aux systèmes d'IA d'observer des structures morphologiques qui ne seraient pas discernables sur des photographies cliniques classiques. Cependant, il n'existe actuellement aucun jeu de données public à grande échelle de segmentation de lésions cutanées (SLC) multi-annotateurs avec des étiquettes d'annotateurs pour l'imagerie dermatoscopique. Nous présentons ISIC MultiAnnot++, un vaste jeu de données public multi-annotateurs pour la segmentation de lésions cutanées à partir d'images de l'Archive ISIC. Le jeu de données final contient 17 684 masques de segmentation couvrant 14 967 images dermatoscopiques, dont 2 394 images possèdent entre 2 et 5 segmentations par image, ce qui en fait le plus grand jeu de données SLC public disponible. De plus, des métadonnées concernant la segmentation, incluant le niveau de compétence des annotateurs et l'outil de segmentation utilisé, sont incluses, permettant des recherches sur des sujets tels que la modélisation des préférences spécifiques aux annotateurs pour la segmentation et l'analyse des métadonnées des annotateurs. Nous fournissons une analyse des caractéristiques de ce jeu de données, des partitions de données organisées et des masques de segmentation par consensus.
English
Multi-annotator medical image segmentation is an important research problem, but requires annotated datasets that are expensive to collect. Dermoscopic skin lesion imaging allows human experts and AI systems to observe morphological structures otherwise not discernable from regular clinical photographs. However, currently there are no large-scale publicly available multi-annotator skin lesion segmentation (SLS) datasets with annotator-labels for dermoscopic skin lesion imaging. We introduce ISIC MultiAnnot++, a large public multi-annotator skin lesion segmentation dataset for images from the ISIC Archive. The final dataset contains 17,684 segmentation masks spanning 14,967 dermoscopic images, where 2,394 dermoscopic images have 2-5 segmentations per image, making it the largest publicly available SLS dataset. Further, metadata about the segmentation, including the annotators' skill level and segmentation tool, is included, enabling research on topics such as annotator-specific preference modeling for segmentation and annotator metadata analysis. We provide an analysis on the characteristics of this dataset, curated data partitions, and consensus segmentation masks.