AtlasPatch: Ein effizientes und skalierbares Werkzeug zur Vorverarbeitung von Ganzpräparat-Scans in der computergestützten Pathologie

Zusammenfassung

Die Vorverarbeitung von Ganzpräparat-Bildern (Whole-Slide Images, WSI), die typischerweise die Gewebeerkennung gefolgt von der Extraktion von Bildausschnitten umfasst, ist grundlegend für KI-gestützte Workflows in der computergestützten Pathologie. Sie stellt nach wie vor einen erheblichen Rechenengpass dar, da bestehende Werkzeuge entweder auf ungenaue heuristische Schwellwertverfahren für die Gewebeerkennung angewiesen sind oder KI-basierte Ansätze verwenden, die auf Daten mit begrenzter Diversität trainiert sind und auf Ebene einzelner Bildausschnitte operieren, was erhebliche Rechenkomplexität verursacht. Wir stellen AtlasPatch vor, ein effizientes und skalierbares Framework zur Vorverarbeitung von Präparatebildern für eine präzise Gewebeerkennung und einen hochdurchsatzfähigen Extraktionsprozess von Bildausschnitten mit minimalem Rechenaufwand. Das Gewebeerkennungsmodul von AtlasPatch wurde auf einem heterogenen, teilmanuell annotierten Datensatz von ~30.000 WSI-Vorschaubildern trainiert, wobei ein effizientes Fine-Tuning des Segment-Anything-Modells zum Einsatz kam. Das Werkzeug extrapoliert Gewebemasken von Vorschaubildern auf hochaufgelöste Vollbilder, um die Koordinaten der Bildausschnitte bei benutzerdefinierten Vergrößerungen zu extrahieren. Es bietet die Möglichkeit, Ausschnitte direkt in gängige Bildencoder zur Einbettung zu streamen oder die Bildausschnitte zu speichern, wobei alle Prozesse effizient über CPUs und GPUs parallelisiert werden. Wir bewerten AtlasPatch hinsichtlich Segmentierungsgenauigkeit, Rechenkomplexität und nachgelagertem Multiple-Instance-Learning. Das Framework erreicht eine mit dem Stand der Technik vergleichbare Leistung, verursacht dabei jedoch nur einen Bruchteil der Rechenkosten. AtlasPatch ist quelloffen und verfügbar unter https://github.com/AtlasAnalyticsLab/AtlasPatch.

English

Whole-slide image (WSI) preprocessing, typically comprising tissue detection followed by patch extraction, is foundational to AI-driven computational pathology workflows. This remains a major computational bottleneck as existing tools either rely on inaccurate heuristic thresholding for tissue detection, or adopt AI-based approaches trained on limited-diversity data that operate at the patch level, incurring substantial computational complexity. We present AtlasPatch, an efficient and scalable slide preprocessing framework for accurate tissue detection and high-throughput patch extraction with minimal computational overhead. AtlasPatch's tissue detection module is trained on a heterogeneous and semi-manually annotated dataset of ~30,000 WSI thumbnails, using efficient fine-tuning of the Segment-Anything model. The tool extrapolates tissue masks from thumbnails to full-resolution slides to extract patch coordinates at user-specified magnifications, with options to stream patches directly into common image encoders for embedding or store patch images, all efficiently parallelized across CPUs and GPUs. We assess AtlasPatch across segmentation precision, computational complexity, and downstream multiple-instance learning, matching state-of-the-art performance while operating at a fraction of their computational cost. AtlasPatch is open-source and available at https://github.com/AtlasAnalyticsLab/AtlasPatch.

AtlasPatch: Ein effizientes und skalierbares Werkzeug zur Vorverarbeitung von Ganzpräparat-Scans in der computergestützten Pathologie

AtlasPatch: An Efficient and Scalable Tool for Whole Slide Image Preprocessing in Computational Pathology

Zusammenfassung

Support