VISTA-PATH: Интерактивная фундаментальная модель для сегментации патологических изображений и количественного анализа в вычислительной патологии
VISTA-PATH: An interactive foundation model for pathology image segmentation and quantitative analysis in computational pathology
January 23, 2026
Авторы: Peixian Liang, Songhao Li, Shunsuke Koga, Yutong Li, Zahra Alipour, Yucheng Tang, Daguang Xu, Zhi Huang
cs.AI
Аннотация
Точная семантическая сегментация гистопатологических изображений крайне важна для количественного анализа тканей и последующего клинического моделирования. Современные фундаментальные модели сегментации улучшили обобщающую способность за счет масштабного предварительного обучения, однако остаются слабо адаптированными к патологии, поскольку трактуют сегментацию как статическую задачу визуального прогнозирования. Мы представляем VISTA-PATH — интерактивную, класс-ориентированную фундаментальную модель сегментации патологических изображений, разработанную для разрешения гетерогенных структур, интеграции экспертной обратной связи и генерации пиксельных сегментаций, имеющих непосредственное значение для клинической интерпретации. VISTA-PATH совместно учитывает при сегментации визуальный контекст, семантические описания тканей и опциональные пространственные подсказки экспертов, что обеспечивает точную многоклассовую сегментацию на разнородных патологических изображениях. Для поддержки данной парадигмы мы создали VISTA-PATH Data — масштабный корпус данных для патологической сегментации, содержащий более 1,6 миллиона троек «изображение-маска-текст», охватывающих 9 органов и 93 класса тканей. На обширных внутренних и внешних тестовых наборах VISTA-PATH последовательно превосходит существующие фундаментальные модели сегментации. Важно, что VISTA-PATH поддерживает динамическое уточнение с участием человека, распространяя разреженные аннотации в виде ограничивающих рамок на уровне патчей на сегментацию целых слайдов. Наконец, мы демонстрируем, что высокоточная класс-ориентированная сегментация, обеспечиваемая VISTA-PATH, делает её предпочтительной моделью для вычислительной патологии. Она улучшает анализ микроокружения ткани за счёт предложенного Tumour Interaction Score (TIS), который демонстрирует сильную и значимую связь с выживаемостью пациентов. В совокупности эти результаты утверждают VISTA-PATH в качестве фундаментальной модели, которая преобразует сегментацию патологических изображений из статического прогноза в интерактивное и клинически обоснованное представление для цифровой патологии. Исходный код и демонстрация доступны по адресу https://github.com/zhihuanglab/VISTA-PATH.
English
Accurate semantic segmentation for histopathology image is crucial for quantitative tissue analysis and downstream clinical modeling. Recent segmentation foundation models have improved generalization through large-scale pretraining, yet remain poorly aligned with pathology because they treat segmentation as a static visual prediction task. Here we present VISTA-PATH, an interactive, class-aware pathology segmentation foundation model designed to resolve heterogeneous structures, incorporate expert feedback, and produce pixel-level segmentation that are directly meaningful for clinical interpretation. VISTA-PATH jointly conditions segmentation on visual context, semantic tissue descriptions, and optional expert-provided spatial prompts, enabling precise multi-class segmentation across heterogeneous pathology images. To support this paradigm, we curate VISTA-PATH Data, a large-scale pathology segmentation corpus comprising over 1.6 million image-mask-text triplets spanning 9 organs and 93 tissue classes. Across extensive held-out and external benchmarks, VISTA-PATH consistently outperforms existing segmentation foundation models. Importantly, VISTA-PATH supports dynamic human-in-the-loop refinement by propagating sparse, patch-level bounding-box annotation feedback into whole-slide segmentation. Finally, we show that the high-fidelity, class-aware segmentation produced by VISTA-PATH is a preferred model for computational pathology. It improve tissue microenvironment analysis through proposed Tumor Interaction Score (TIS), which exhibits strong and significant associations with patient survival. Together, these results establish VISTA-PATH as a foundation model that elevates pathology image segmentation from a static prediction to an interactive and clinically grounded representation for digital pathology. Source code and demo can be found at https://github.com/zhihuanglab/VISTA-PATH.