VISTA-PATH: 계산 병리학에서 병리 이미지 분할 및 정량적 분석을 위한 상호작용형 파운데이션 모델
VISTA-PATH: An interactive foundation model for pathology image segmentation and quantitative analysis in computational pathology
January 23, 2026
저자: Peixian Liang, Songhao Li, Shunsuke Koga, Yutong Li, Zahra Alipour, Yucheng Tang, Daguang Xu, Zhi Huang
cs.AI
초록
조직병리 이미지의 정확한 의미론적 분할은 정량적 조직 분석과 후속 임상 모델링에 중요합니다. 최근의 분할 기초 모델들은 대규모 사전 학습을 통해 일반화 성능을 향상시켰지만, 분할을 정적인 시각 예측 작업으로 간주하기 때문에 병리학 분야와의 정합성이 부족한 실정입니다. 본 연구에서는 이질적 구조 해결, 전문가 피드백 통합, 임상 해석에 직접적으로 의미 있는 픽셀 수준 분할 생산이 가능한 대화형 클래스 인식 병리 분할 기초 모델 VISTA-PATH를 제시합니다. VISTA-PATH는 시각적 문맥, 의미론적 조직 설명, 선택적 전문가 공간 프롬프트를 결합하여 조건 설정함으로써 이질적 병리 이미지 전반에 걸친 정밀한 다중 클래스 분할을 가능하게 합니다. 이러한 패러다임을 지원하기 위해 9개 장기와 93개 조직 등급을 아우르는 160만 개 이상의 이미지-마스크-텍스트 삼중항으로 구성된 대규모 병리 분할 코퍼스 VISTA-PATH Data를 구축했습니다. 광범위한 홀드아웃 및 외부 벤치마크에서 VISTA-PATH는 기존 분할 기초 모델들을 지속적으로 능가했습니다. 특히 VISTA-PATH는 희소 패치 수준 경계상자 주석 피드백을 전체 슬라이드 분할로 전파함으로써 동적 인간 참여형 정제를 지원합니다. 마지막으로, VISTA-PATH가 생성하는 고정밀 클래스 인식 분할이 계산 병리학에 적합한 모델임을 입증합니다. 제안된 종양 상호작용 점수(TIS)를 통한 조직 미세환경 분석 개선 효과를 확인했으며, 해당 점수는 환자 생존율과 유의미한 연관성을 보였습니다. 종합적으로, 이러한 결과들은 VISTA-PATH가 병리 이미지 분할을 정적 예측에서 디지털 병리를 위한 대화형·임상 기반 표현으로 격상시키는 기초 모델임을 입증합니다. 소스 코드와 데모는 https://github.com/zhihuanglab/VISTA-PATH에서 확인할 수 있습니다.
English
Accurate semantic segmentation for histopathology image is crucial for quantitative tissue analysis and downstream clinical modeling. Recent segmentation foundation models have improved generalization through large-scale pretraining, yet remain poorly aligned with pathology because they treat segmentation as a static visual prediction task. Here we present VISTA-PATH, an interactive, class-aware pathology segmentation foundation model designed to resolve heterogeneous structures, incorporate expert feedback, and produce pixel-level segmentation that are directly meaningful for clinical interpretation. VISTA-PATH jointly conditions segmentation on visual context, semantic tissue descriptions, and optional expert-provided spatial prompts, enabling precise multi-class segmentation across heterogeneous pathology images. To support this paradigm, we curate VISTA-PATH Data, a large-scale pathology segmentation corpus comprising over 1.6 million image-mask-text triplets spanning 9 organs and 93 tissue classes. Across extensive held-out and external benchmarks, VISTA-PATH consistently outperforms existing segmentation foundation models. Importantly, VISTA-PATH supports dynamic human-in-the-loop refinement by propagating sparse, patch-level bounding-box annotation feedback into whole-slide segmentation. Finally, we show that the high-fidelity, class-aware segmentation produced by VISTA-PATH is a preferred model for computational pathology. It improve tissue microenvironment analysis through proposed Tumor Interaction Score (TIS), which exhibits strong and significant associations with patient survival. Together, these results establish VISTA-PATH as a foundation model that elevates pathology image segmentation from a static prediction to an interactive and clinically grounded representation for digital pathology. Source code and demo can be found at https://github.com/zhihuanglab/VISTA-PATH.