VISTA-PATH: Um modelo de base interativo para segmentação de imagens patológicas e análise quantitativa em patologia computacional
VISTA-PATH: An interactive foundation model for pathology image segmentation and quantitative analysis in computational pathology
January 23, 2026
Autores: Peixian Liang, Songhao Li, Shunsuke Koga, Yutong Li, Zahra Alipour, Yucheng Tang, Daguang Xu, Zhi Huang
cs.AI
Resumo
A segmentação semântica precisa de imagens histopatológicas é crucial para a análise quantitativa de tecidos e modelagem clínica subsequente. Modelos de segmentação fundamentais recentes melhoraram a generalização por meio de pré-treinamento em larga escala, mas permanecem mal alinhados com a patologia porque tratam a segmentação como uma tarefa de previsão visual estática. Apresentamos aqui o VISTA-PATH, um modelo fundamental de segmentação patológica interativo e consciente de classes, projetado para resolver estruturas heterogêneas, incorporar feedback de especialistas e produzir segmentações a nível de pixel que são diretamente significativas para a interpretação clínica. O VISTA-PATH condiciona conjuntamente a segmentação no contexto visual, descrições semânticas de tecidos e prompts espaciais opcionais fornecidos por especialistas, permitindo segmentação multiclasse precisa em imagens patológicas heterogêneas. Para suportar este paradigma, curamos o VISTA-PATH Data, um corpus de segmentação patológica em larga escala compreendendo mais de 1,6 milhão de triplas imagem-máscara-texto abrangendo 9 órgãos e 93 classes de tecidos. Em extensos benchmarks externos e de hold-out, o VISTA-PATH supera consistentemente os modelos fundamentais de segmentação existentes. Importantemente, o VISTA-PATH suporta refinamento dinâmico com humano no loop propagando feedback de anotação esparsa com caixas delimitadoras a nível de patch para segmentação de lâmina inteira. Finalmente, mostramos que a segmentação de alta fidelidade e consciente de classes produzida pelo VISTA-PATH é um modelo preferido para patologia computacional. Ele melhora a análise do microambiente tissular através do proposto Tumor Interaction Score (TIS), que exibe associações fortes e significativas com a sobrevida do paciente. Juntos, estes resultados estabelecem o VISTA-PATH como um modelo fundamental que eleva a segmentação de imagens patológicas de uma previsão estática para uma representação interativa e clinicamente fundamentada para patologia digital. Código fonte e demonstração podem ser encontrados em https://github.com/zhihuanglab/VISTA-PATH.
English
Accurate semantic segmentation for histopathology image is crucial for quantitative tissue analysis and downstream clinical modeling. Recent segmentation foundation models have improved generalization through large-scale pretraining, yet remain poorly aligned with pathology because they treat segmentation as a static visual prediction task. Here we present VISTA-PATH, an interactive, class-aware pathology segmentation foundation model designed to resolve heterogeneous structures, incorporate expert feedback, and produce pixel-level segmentation that are directly meaningful for clinical interpretation. VISTA-PATH jointly conditions segmentation on visual context, semantic tissue descriptions, and optional expert-provided spatial prompts, enabling precise multi-class segmentation across heterogeneous pathology images. To support this paradigm, we curate VISTA-PATH Data, a large-scale pathology segmentation corpus comprising over 1.6 million image-mask-text triplets spanning 9 organs and 93 tissue classes. Across extensive held-out and external benchmarks, VISTA-PATH consistently outperforms existing segmentation foundation models. Importantly, VISTA-PATH supports dynamic human-in-the-loop refinement by propagating sparse, patch-level bounding-box annotation feedback into whole-slide segmentation. Finally, we show that the high-fidelity, class-aware segmentation produced by VISTA-PATH is a preferred model for computational pathology. It improve tissue microenvironment analysis through proposed Tumor Interaction Score (TIS), which exhibits strong and significant associations with patient survival. Together, these results establish VISTA-PATH as a foundation model that elevates pathology image segmentation from a static prediction to an interactive and clinically grounded representation for digital pathology. Source code and demo can be found at https://github.com/zhihuanglab/VISTA-PATH.