ChatPaper.aiChatPaper

細胞タイプごとに1クリックで十分:学習不要のグループ相互作用による細胞インスタンスセグメンテーション

One Click per Cell Type Suffices: Training-free Group Interaction for Cell Instance Segmentation

May 28, 2026
著者: Sanghyun Jo, Seo Jin Lee, Seohyung Hong, Yoorim Gang, Hyeongsub Kim, Hyungseok Seo, Kyungsu Kim
cs.AI

要旨

細胞特化型データセットで学習された細胞インスタンス分割モデルは、分布外の細胞タイプに対して深刻な性能低下を示す一方、対話型基盤モデルはインスタンス単位のプロンプティングによりこの問題を克服するが、数百から数千の密に配置されたインスタンスを含む病理組織画像にはコストが法外に高い。我々は、対話型セグメンテーションをインスタンス単位のO(N)からタイプ単位のO(T)へとシフトさせる新たなパラダイム「Group Prompting」を導入する。ここでは、細胞タイプごとに1回のクリックでそのタイプの全インスタンスをセグメント化できる。我々の重要な知見は、Segment Anything Model (SAM)の凍結画像エンコーダが、プロンプトが与えられる前からその特徴空間において同一タイプの細胞をクラスタ化していることである。この特性を活用し、我々は訓練不要のフレームワーク「Chain-of-Prompts (CoP)」を提案する。これは、ユーザーの単一クリックを、(1)マルチスケールエンコーダ特徴に対するノンパラメトリックゲーティングにより信頼できる同一タイプの位置を特定し、(2)最も空間的に離れた信頼点を次のプロンプトとして選択して被覆範囲を最大化する、という再帰的拡張を行う。3つの細胞タイプ注釈付きベンチマークにおいて、タイプごとに1クリックのCoPはインスタンス単位の性能の90%以上を維持し、追加訓練なしで完全教師あり手法を凌駕する。4つの形態的に均質なベンチマークでは、単一クリックで99%以上を維持する。プロジェクトページ: https://shjo-april.github.io/Chain-of-Prompts/
English
Cell instance segmentation models trained on cell-specific datasets suffer severe performance drops on out-of-distribution cell types, while interactive foundation models overcome this through per-instance prompting at a cost that is prohibitively expensive for histopathology images containing hundreds to thousands of densely packed instances. We introduce Group Prompting, a new paradigm that shifts interactive segmentation from per-instance O(N) to per-type O(T), where a single click per cell type suffices to segment all instances of that type. Our key observation is that the frozen image encoder of the Segment Anything Model (SAM) already clusters same-type cells in its feature space before any prompt is given. Exploiting this property, we propose Chain-of-Prompts (CoP), a training-free framework that recursively expands a single user click by (1) identifying reliable same-type locations through non-parametric gating of multi-scale encoder features, and (2) selecting the most spatially distant reliable point as the next prompt to maximize coverage. On three cell-type-annotated benchmarks, CoP with one click per type retains over 90% of per-instance performance and surpasses fully-supervised methods without any additional training. On four morphologically homogeneous benchmarks, a single click retains over 99%. Project Page: https://shjo-april.github.io/Chain-of-Prompts/