AtlasPatch: Uma Ferramenta Eficiente e Escalável para Pré-processamento de Imagens de Lâmina Completa em Patologia Computacional
AtlasPatch: An Efficient and Scalable Tool for Whole Slide Image Preprocessing in Computational Pathology
February 3, 2026
Autores: Ahmed Alagha, Christopher Leclerc, Yousef Kotp, Omar Metwally, Calvin Moras, Peter Rentopoulos, Ghodsiyeh Rostami, Bich Ngoc Nguyen, Jumanah Baig, Abdelhakim Khellaf, Vincent Quoc-Huy Trinh, Rabeb Mizouni, Hadi Otrok, Jamal Bentahar, Mahdi S. Hosseini
cs.AI
Resumo
O pré-processamento de imagens de lâmina completa (WSI), tipicamente composto por detecção de tecido seguida de extração de patches, é fundamental para os fluxos de trabalho de patologia computacional orientada por IA. Este processo continua a ser um grande gargalo computacional, pois as ferramentas existentes ou dependem de limiarização heurística imprecisa para detecção de tecido, ou adotam abordagens baseadas em IA treinadas em dados de diversidade limitada que operam ao nível do patch, incorrendo em substancial complexidade computacional. Apresentamos o AtlasPatch, uma estrutura de pré-processamento de lâminas eficiente e escalável para detecção precisa de tecido e extração de patches de alto rendimento com sobrecarga computacional mínima. O módulo de detecção de tecido do AtlasPatch é treinado num conjunto de dados heterogéneo e semimanualmente anotado de ~30.000 miniaturas de WSI, utilizando *fine-tuning* eficiente do modelo Segment Anything. A ferramenta extrapola as máscaras de tecido das miniaturas para lâminas em resolução completa para extrair coordenadas de patches em ampliações especificadas pelo utilizador, com opções para transmitir os patches diretamente para codificadores de imagem comuns para *embedding* ou armazenar as imagens dos patches, tudo eficientemente paralelizado através de CPUs e GPUs. Avaliamos o AtlasPatch em termos de precisão de segmentação, complexidade computacional e aprendizagem de múltiplas instâncias (*multiple-instance learning*) subsequente, equiparando o desempenho de última geração enquanto opera a uma fração do seu custo computacional. O AtlasPatch é de código aberto e está disponível em https://github.com/AtlasAnalyticsLab/AtlasPatch.
English
Whole-slide image (WSI) preprocessing, typically comprising tissue detection followed by patch extraction, is foundational to AI-driven computational pathology workflows. This remains a major computational bottleneck as existing tools either rely on inaccurate heuristic thresholding for tissue detection, or adopt AI-based approaches trained on limited-diversity data that operate at the patch level, incurring substantial computational complexity. We present AtlasPatch, an efficient and scalable slide preprocessing framework for accurate tissue detection and high-throughput patch extraction with minimal computational overhead. AtlasPatch's tissue detection module is trained on a heterogeneous and semi-manually annotated dataset of ~30,000 WSI thumbnails, using efficient fine-tuning of the Segment-Anything model. The tool extrapolates tissue masks from thumbnails to full-resolution slides to extract patch coordinates at user-specified magnifications, with options to stream patches directly into common image encoders for embedding or store patch images, all efficiently parallelized across CPUs and GPUs. We assess AtlasPatch across segmentation precision, computational complexity, and downstream multiple-instance learning, matching state-of-the-art performance while operating at a fraction of their computational cost. AtlasPatch is open-source and available at https://github.com/AtlasAnalyticsLab/AtlasPatch.