Medical SAM 2: セグメント・エニシングモデル2を用いて医療画像を動画としてセグメント化
Medical SAM 2: Segment medical images as video via Segment Anything Model 2
August 1, 2024
著者: Jiayuan Zhu, Yunli Qi, Junde Wu
cs.AI
要旨
本論文では、SAM 2フレームワークを活用し、2Dおよび3D医用画像セグメンテーションタスクに対応する高度なセグメンテーションモデルであるMedical SAM 2(MedSAM-2)を紹介します。MedSAM-2は、医用画像をビデオとして扱うという哲学を採用することで、3D医用画像に適用可能なだけでなく、新たな「ワンプロンプトセグメンテーション」機能を実現します。この機能により、ユーザーは特定の画像内の対象物に対して1つのプロンプトを提供するだけで、モデルがその後のすべての画像において、画像間の時間的関係に関係なく、同じタイプの対象物を自律的にセグメント化することが可能となります。MedSAM-2は、腹部臓器、視神経乳頭、脳腫瘍、甲状腺結節、皮膚病変など、さまざまな医用画像モダリティにおいて評価を行い、従来のセグメンテーション設定およびインタラクティブセグメンテーション設定での最先端モデルと比較しました。その結果、MedSAM-2は既存のモデルを性能で上回るだけでなく、幅広い医用画像セグメンテーションタスクにおいて優れた汎化性能を示すことが明らかになりました。私たちのコードは以下のURLで公開されます:https://github.com/MedicineToken/Medical-SAM2
English
In this paper, we introduce Medical SAM 2 (MedSAM-2), an advanced
segmentation model that utilizes the SAM 2 framework to address both 2D and 3D
medical image segmentation tasks. By adopting the philosophy of taking medical
images as videos, MedSAM-2 not only applies to 3D medical images but also
unlocks new One-prompt Segmentation capability. That allows users to provide a
prompt for just one or a specific image targeting an object, after which the
model can autonomously segment the same type of object in all subsequent
images, regardless of temporal relationships between the images. We evaluated
MedSAM-2 across a variety of medical imaging modalities, including abdominal
organs, optic discs, brain tumors, thyroid nodules, and skin lesions, comparing
it against state-of-the-art models in both traditional and interactive
segmentation settings. Our findings show that MedSAM-2 not only surpasses
existing models in performance but also exhibits superior generalization across
a range of medical image segmentation tasks. Our code will be released at:
https://github.com/MedicineToken/Medical-SAM2Summary
AI-Generated Summary