ChatPaper.aiChatPaper

췌장관선암 혈관 침습 평가: PDACVI 벤치마크

Assessing Pancreatic Ductal Adenocarcinoma Vascular Invasion: the PDACVI Benchmark

April 30, 2026
저자: M. Riera-Marín, O. K. Sikha, J. Rodríguez-Comas, M. S. May, T. Kirscher, X. Coubez, P. Meyer, S. Faisan, Z. Pan, X. Zhou, X. Liang, C. Hémon, V. Boussot, J. -L. Dillenseger, J. -C. Nunes, K. -C. Kahl, C. Lüth, J. Traub, P. -H. Conze, M. M. Duh, A. Aubanell, R. de Figueiredo Cardoso, S. Egger-Hackenschmidt, J. García-López, M. A. González-Ballester, A. Galdran
cs.AI

초록

췌관선암(PDAC)의 유일한 잠재적 치유적 치료법으로서 외과적 절제술의 적용 가능성은 혈관 침범(VI), 즉 종양이 인접한 주요 혈관으로의 침습 정도를 정확히 평가하는 것에 달려 있습니다. 수술 전 병기 결정 및 수술 계획 수립에 중요함에도 불구하고, 계산적 VI 평가는 아직까지 충분히 연구되지 않았습니다. 주요 난제는 공개 데이터셋의 부족과 종양-혈관 경계면에서의 진단적 모호성으로, 이는 전문 영상의학과 의사들 사이에서도 상당한 판독자 간 변이를 초래합니다. 이러한 한계를 해결하기 위해, 본 연구에서는 스캔당 5명의 독립적 전문가 주석이 포함된 밀집 주석 데이터셋을 기반으로 한 PDAC 병기 결정을 위한 불확실성 인식 AI 공개 벤치마크인 CURVAS-PDACVI 데이터셋 및 챌린지를 소개합니다. 또한 공간 중첩을 넘어 확률적 보정 및 VI 평가를 포함하는 다중 지표 평가 체계를 제안합니다. 6가지 최신 기법에 대한 평가 결과, 강력한 전역 체적 중첩 성능이 반드시 임상적으로 중요한 종양-혈관 경계면에서의 신뢰할 수 있는 성능으로 이어지지는 않는 것으로 나타났습니다. 특히, 이진 분할을 위해 최적화된 기법들은 평균 중첩 지표에서는 경쟁력 있는 성능을 보이지만, 전문가 합의도가 낮은 고복잡도 사례에서는 체적이 급격히 줄어들거나 불확실한 경계에서 과도하게 확장되는 등 성능이 저하되는 경우가 많았습니다. 반면, 판독자 간 불일치를 모델링하는 기법들은 더 잘 보정된 확률 지도를 생성하고 이러한 모호한 사례에서 더 큰 강건성을 보였습니다. 본 벤치마크는 국소적 수술 유용성의 대리 지표로서 체적 정확도의 한계를 부각시키며, 수술 전 의사 결정을 위한 불확실성 인식 확률 모델의 필요성을 제시합니다.
English
Surgical resection remains the only potentially curative treatment for pancreatic ductal adenocarcinoma (PDAC), and eligibility depends on accurate assessment of vascular invasion (VI), i.e., tumor extension into adjacent critical vessels. Despite its importance for preoperative staging and surgical planning, computational VI assessment remains underexplored. Two major challenges are the lack of public datasets and the diagnostic ambiguity at the tumor-vessel interface, which leads to substantial inter-rater variability even among expert radiologists. To address these limitations, we introduce the CURVAS-PDACVI Dataset and Challenge, an open benchmark for uncertainty-aware AI in PDAC staging based on a densely annotated dataset with five independent expert annotations per scan. We also propose a multi-metric evaluation framework that extends beyond spatial overlap to include probabilistic calibration and VI assessment. Evaluation of six state-of-the-art methods shows that strong global volumetric overlap does not necessarily translate into reliable performance at clinically critical tumor-vessel interfaces. In particular, methods optimized for binary segmentation perform competitively on average overlap metrics, but often degrade in high-complexity cases with low expert consensus, either collapsing in volume or overextending at uncertain boundaries. In contrast, methods that model inter-rater disagreement produce better calibrated probabilistic maps and show greater robustness in these ambiguous cases. The benchmark highlights the limitations of volumetric accuracy as a proxy for localized surgical utility, motivating uncertainty-aware probabilistic models for preoperative decision-making.
PDF11May 6, 2026