IMA++: ISICアーカイブ マルチアノテーター皮膚鏡画像皮膚病変セグメンテーションデータセット
IMA++: ISIC Archive Multi-Annotator Dermoscopic Skin Lesion Segmentation Dataset
December 25, 2025
著者: Kumar Abhishek, Jeremy Kawahara, Ghassan Hamarneh
cs.AI
要旨
マルチアノテーター医療画像セグメンテーションは重要な研究課題であるが、収集にコストがかかる注釈付きデータセットを必要とする。ダーモスコピック皮膚病変画像は、通常の臨床写真では識別できない形態学的構造を人間の専門家やAIシステムが観察することを可能にする。しかし、現在、アノテーターラベル付きの大規模な公開マルチアノテーター皮膚病変セグメンテーション(SLS)データセットは存在しない。本研究では、ISICアーカイブの画像を用いた大規模な公開マルチアノテーター皮膚病変セグメンテーションデータセットであるISIC MultiAnnot++を紹介する。最終データセットは14,967枚のダーモスコピック画像にまたがる17,684のセグメンテーションマスクを含み、うち2,394枚の画像には1画像あたり2~5個のセグメンテーションが付与されており、公開されているSLSデータセットとしては最大規模である。さらに、アノテーターの技能レベルや使用ツールなどのセグメンテーションに関するメタデータを含むため、セグメンテーションにおけるアノテーター固有の選好モデリングやメタデータ分析などの研究を可能にする。本データセットの特性分析、精選されたデータ分割、および合意セグメンテーションマスクについても提供する。
English
Multi-annotator medical image segmentation is an important research problem, but requires annotated datasets that are expensive to collect. Dermoscopic skin lesion imaging allows human experts and AI systems to observe morphological structures otherwise not discernable from regular clinical photographs. However, currently there are no large-scale publicly available multi-annotator skin lesion segmentation (SLS) datasets with annotator-labels for dermoscopic skin lesion imaging. We introduce ISIC MultiAnnot++, a large public multi-annotator skin lesion segmentation dataset for images from the ISIC Archive. The final dataset contains 17,684 segmentation masks spanning 14,967 dermoscopic images, where 2,394 dermoscopic images have 2-5 segmentations per image, making it the largest publicly available SLS dataset. Further, metadata about the segmentation, including the annotators' skill level and segmentation tool, is included, enabling research on topics such as annotator-specific preference modeling for segmentation and annotator metadata analysis. We provide an analysis on the characteristics of this dataset, curated data partitions, and consensus segmentation masks.