ChatPaper.aiChatPaper

AtlasPatch: 계산 병리학에서 전체 슬라이드 이미지 전처리를 위한 효율적이고 확장 가능한 도구

AtlasPatch: An Efficient and Scalable Tool for Whole Slide Image Preprocessing in Computational Pathology

February 3, 2026
저자: Ahmed Alagha, Christopher Leclerc, Yousef Kotp, Omar Metwally, Calvin Moras, Peter Rentopoulos, Ghodsiyeh Rostami, Bich Ngoc Nguyen, Jumanah Baig, Abdelhakim Khellaf, Vincent Quoc-Huy Trinh, Rabeb Mizouni, Hadi Otrok, Jamal Bentahar, Mahdi S. Hosseini
cs.AI

초록

전체 슬라이드 이미지(WSI) 전처리는 일반적으로 조직 검출과 패치 추출로 구성되며, AI 기반 계산 병리학 워크플로우의 기초를 이룹니다. 이 과정은 여전히 주요 계산 병목 현상으로 남아있는데, 기존 도구들은 조직 검출을 위해 부정확한 경험적 임계값 처리에 의존하거나, 제한된 다양성의 데이터로 훈련된 패치 수준 AI 접근법을 채택하여 상당한 계산 복잡성을 초래하기 때문입니다. 본 연구에서는 정확한 조직 검출과 최소한의 계산 오버헤드로 높은 처리량의 패치 추출을 가능하게 하는 효율적이고 확장 가능한 슬라이드 전처리 프레임워크인 AtlasPatch를 제안합니다. AtlasPatch의 조직 검출 모듈은 약 30,000개의 WSI 썸네일로 구성된 이질적이고 반자동 주석이 달린 데이터셋을 사용하여 Segment-Anything 모델을 효율적으로 미세 조정하여 훈련되었습니다. 이 도구는 썸네일에서 추정된 조직 마스크를 전체 해상도 슬라이드로 확장하여 사용자가 지정한 배율에서 패치 좌표를 추출하며, 패치를 일반 이미지 인코더로 직접 스트리밍하여 임베딩을 생성하거나 패치 이미지를 저장할 수 있는 옵션을 제공합니다. 이 모든 과정은 CPU와 GPU에서 효율적으로 병렬 처리됩니다. 우리는 AtlasPatch를 분할 정확도, 계산 복잡도, 하위 다중 인스턴스 학습 성능 측면에서 평가하였으며, 최첨단 성능을 유지하면서 그들의 계산 비용의 일부만으로 운영됨을 확인했습니다. AtlasPatch는 오픈소스이며 https://github.com/AtlasAnalyticsLab/AtlasPatch에서 이용 가능합니다.
English
Whole-slide image (WSI) preprocessing, typically comprising tissue detection followed by patch extraction, is foundational to AI-driven computational pathology workflows. This remains a major computational bottleneck as existing tools either rely on inaccurate heuristic thresholding for tissue detection, or adopt AI-based approaches trained on limited-diversity data that operate at the patch level, incurring substantial computational complexity. We present AtlasPatch, an efficient and scalable slide preprocessing framework for accurate tissue detection and high-throughput patch extraction with minimal computational overhead. AtlasPatch's tissue detection module is trained on a heterogeneous and semi-manually annotated dataset of ~30,000 WSI thumbnails, using efficient fine-tuning of the Segment-Anything model. The tool extrapolates tissue masks from thumbnails to full-resolution slides to extract patch coordinates at user-specified magnifications, with options to stream patches directly into common image encoders for embedding or store patch images, all efficiently parallelized across CPUs and GPUs. We assess AtlasPatch across segmentation precision, computational complexity, and downstream multiple-instance learning, matching state-of-the-art performance while operating at a fraction of their computational cost. AtlasPatch is open-source and available at https://github.com/AtlasAnalyticsLab/AtlasPatch.
PDF42March 16, 2026