VISTA-PATH : Un modèle fondateur interactif pour la segmentation d'images pathologiques et l'analyse quantitative en pathologie computationnelle
VISTA-PATH: An interactive foundation model for pathology image segmentation and quantitative analysis in computational pathology
January 23, 2026
Auteurs: Peixian Liang, Songhao Li, Shunsuke Koga, Yutong Li, Zahra Alipour, Yucheng Tang, Daguang Xu, Zhi Huang
cs.AI
Résumé
La segmentation sémantique précise des images histopathologiques est cruciale pour l'analyse quantitative des tissus et la modélisation clinique subséquente. Les modèles de fondation récents pour la segmentation ont amélioré la généralisation grâce à un pré-entraînement à grande échelle, mais restent mal alignés avec la pathologie car ils traitent la segmentation comme une tâche de prédiction visuelle statique. Nous présentons ici VISTA-PATH, un modèle de fondation interactif et conscient des classes pour la segmentation pathologique, conçu pour résoudre des structures hétérogènes, intégrer les retours d'experts et produire des segmentations au niveau pixel directement significatives pour l'interprétation clinique. VISTA-PATH conditionne conjointement la segmentation sur le contexte visuel, les descriptions sémantiques des tissus et des invites spatiales optionnelles fournies par des experts, permettant une segmentation multi-classes précise sur des images pathologiques hétérogènes. Pour soutenir ce paradigme, nous avons constitué VISTA-PATH Data, un corpus de segmentation pathologique à grande échelle comprenant plus de 1,6 million de triplets image-masque-texte couvrant 9 organes et 93 classes de tissus. Sur de nombreux benchmarks externes et de validation rigoureux, VISTA-PATH surpasse constamment les modèles de fondation existants pour la segmentation. Fait important, VISTA-PATH prend en charge un affinage dynamique avec intervention humaine en propageant les retours d'annotation par boîtes englobantes éparses au niveau de patchs dans la segmentation de lames entières. Enfin, nous montrons que la segmentation haute fidélité et consciente des classes produite par VISTA-PATH est un modèle privilégié pour la pathologie computationnelle. Elle améliore l'analyse du microenvironnement tumoral grâce au Score d'Interaction Tumorale (SIT) proposé, qui présente des associations fortes et significatives avec la survie des patients. Ensemble, ces résultats établissent VISTA-PATH comme un modèle de fondation qui élève la segmentation d'images pathologiques d'une prédiction statique à une représentation interactive et ancrée cliniquement pour la pathologie numérique. Le code source et une démonstration sont disponibles à l'adresse https://github.com/zhihuanglab/VISTA-PATH.
English
Accurate semantic segmentation for histopathology image is crucial for quantitative tissue analysis and downstream clinical modeling. Recent segmentation foundation models have improved generalization through large-scale pretraining, yet remain poorly aligned with pathology because they treat segmentation as a static visual prediction task. Here we present VISTA-PATH, an interactive, class-aware pathology segmentation foundation model designed to resolve heterogeneous structures, incorporate expert feedback, and produce pixel-level segmentation that are directly meaningful for clinical interpretation. VISTA-PATH jointly conditions segmentation on visual context, semantic tissue descriptions, and optional expert-provided spatial prompts, enabling precise multi-class segmentation across heterogeneous pathology images. To support this paradigm, we curate VISTA-PATH Data, a large-scale pathology segmentation corpus comprising over 1.6 million image-mask-text triplets spanning 9 organs and 93 tissue classes. Across extensive held-out and external benchmarks, VISTA-PATH consistently outperforms existing segmentation foundation models. Importantly, VISTA-PATH supports dynamic human-in-the-loop refinement by propagating sparse, patch-level bounding-box annotation feedback into whole-slide segmentation. Finally, we show that the high-fidelity, class-aware segmentation produced by VISTA-PATH is a preferred model for computational pathology. It improve tissue microenvironment analysis through proposed Tumor Interaction Score (TIS), which exhibits strong and significant associations with patient survival. Together, these results establish VISTA-PATH as a foundation model that elevates pathology image segmentation from a static prediction to an interactive and clinically grounded representation for digital pathology. Source code and demo can be found at https://github.com/zhihuanglab/VISTA-PATH.