AtlasPatch: 計算病理学における全スライド画像前処理のための効率的かつスケーラブルなツール
AtlasPatch: An Efficient and Scalable Tool for Whole Slide Image Preprocessing in Computational Pathology
February 3, 2026
著者: Ahmed Alagha, Christopher Leclerc, Yousef Kotp, Omar Metwally, Calvin Moras, Peter Rentopoulos, Ghodsiyeh Rostami, Bich Ngoc Nguyen, Jumanah Baig, Abdelhakim Khellaf, Vincent Quoc-Huy Trinh, Rabeb Mizouni, Hadi Otrok, Jamal Bentahar, Mahdi S. Hosseini
cs.AI
要旨
全スライド画像(WSI)の前処理は、通常、組織検出とパッチ抽出から構成され、AI駆動の計算病理学ワークフローの基盤をなす。既存ツールは、不正確なヒューリスティックなしきい値処理に依存するか、限定的な多様性のデータで学習したパッチレベルで動作するAIベースのアプローチを採用するため、計算量が膨大になり、主要な計算ボトルネックとなっている。本研究では、最小限の計算オーバーヘッドで正確な組織検出と高スループットなパッチ抽出を実現する、効率的かつスケーラブルなスライド前処理フレームワーク「AtlasPatch」を提案する。AtlasPatchの組織検出モジュールは、約3万枚のWSIサムネイルからなる多様性に富み半手動で注釈付けされたデータセットを用い、Segment-Anythingモデルの効率的なファインチューニングによって学習される。本ツールはサムネイルから組織マスクを全解像度スライドに外挿し、ユーザ指定の倍率でパッチ座標を抽出する。パッチを共通の画像エンコーダーに直接ストリーミングして埋め込みを生成するか、パッチ画像として保存するオプションを備え、CPUとGPU全体で効率的に並列化される。セグメンテーション精度、計算量、下流のマルチインスタンス学習において評価した結果、従来手法の計算コストのごく一部で、最先端の性能に匹敵する性能を達成した。AtlasPatchはオープンソースであり、https://github.com/AtlasAnalyticsLab/AtlasPatch で公開されている。
English
Whole-slide image (WSI) preprocessing, typically comprising tissue detection followed by patch extraction, is foundational to AI-driven computational pathology workflows. This remains a major computational bottleneck as existing tools either rely on inaccurate heuristic thresholding for tissue detection, or adopt AI-based approaches trained on limited-diversity data that operate at the patch level, incurring substantial computational complexity. We present AtlasPatch, an efficient and scalable slide preprocessing framework for accurate tissue detection and high-throughput patch extraction with minimal computational overhead. AtlasPatch's tissue detection module is trained on a heterogeneous and semi-manually annotated dataset of ~30,000 WSI thumbnails, using efficient fine-tuning of the Segment-Anything model. The tool extrapolates tissue masks from thumbnails to full-resolution slides to extract patch coordinates at user-specified magnifications, with options to stream patches directly into common image encoders for embedding or store patch images, all efficiently parallelized across CPUs and GPUs. We assess AtlasPatch across segmentation precision, computational complexity, and downstream multiple-instance learning, matching state-of-the-art performance while operating at a fraction of their computational cost. AtlasPatch is open-source and available at https://github.com/AtlasAnalyticsLab/AtlasPatch.