Évaluation de l'Invasion Vasculaire dans l'Adénocarcinomacanalaire Pancréatique : le Référentiel PDACVI
Assessing Pancreatic Ductal Adenocarcinoma Vascular Invasion: the PDACVI Benchmark
April 30, 2026
Auteurs: M. Riera-Marín, O. K. Sikha, J. Rodríguez-Comas, M. S. May, T. Kirscher, X. Coubez, P. Meyer, S. Faisan, Z. Pan, X. Zhou, X. Liang, C. Hémon, V. Boussot, J. -L. Dillenseger, J. -C. Nunes, K. -C. Kahl, C. Lüth, J. Traub, P. -H. Conze, M. M. Duh, A. Aubanell, R. de Figueiredo Cardoso, S. Egger-Hackenschmidt, J. García-López, M. A. González-Ballester, A. Galdran
cs.AI
Résumé
La résection chirurgicale demeure le seul traitement potentiellement curatif de l'adénocarcinome canalaire pancréatique (PDAC), et l'éligibilité dépend d'une évaluation précise de l'envahissement vasculaire (VI), c'est-à-dire de l'extension tumorale dans les vaisseaux critiques adjacents. Malgré son importance pour le staging préopératoire et la planification chirurgicale, l'évaluation computationnelle du VI reste peu explorée. Deux défis majeurs sont le manque de jeux de données publics et l'ambiguïté diagnostique à l'interface tumeur-vaisseau, ce qui entraîne une variabilité inter-évaluateurs substantielle, même parmi les radiologues experts. Pour remédier à ces limitations, nous présentons le Jeu de Données et Défi CURVAS-PDACVI, un benchmark ouvert pour l'IA consciente de l'incertitude dans le staging du PDAC, basé sur un jeu de données densément annoté avec cinq annotations expertes indépendantes par scan. Nous proposons également un cadre d'évaluation multi-métriques qui va au-delà du chevauchement spatial pour inclure l'étalonnage probabiliste et l'évaluation du VI. L'évaluation de six méthodes de pointe montre qu'un fort chevauchement volumique global ne se traduit pas nécessairement par une performance fiable aux interfaces tumeur-vaisseau cliniquement critiques. En particulier, les méthodes optimisées pour la segmentation binaire obtiennent des résultats compétitifs sur les métriques de chevauchement moyen, mais se dégradent souvent dans les cas de haute complexité avec un faible consensus d'experts, soit en s'effondrant en volume, soit en s'étendant excessivement aux frontières incertaines. En revanche, les méthodes qui modélisent le désaccord inter-évaluateurs produisent des cartes probabilistes mieux étalonnées et font preuve d'une plus grande robustesse dans ces cas ambigus. Le benchmark met en lumière les limites de la précision volumique comme indicateur de l'utilité chirurgicale localisée, motivant le développement de modèles probabilistes conscients de l'incertitude pour la prise de décision préopératoire.
English
Surgical resection remains the only potentially curative treatment for pancreatic ductal adenocarcinoma (PDAC), and eligibility depends on accurate assessment of vascular invasion (VI), i.e., tumor extension into adjacent critical vessels. Despite its importance for preoperative staging and surgical planning, computational VI assessment remains underexplored. Two major challenges are the lack of public datasets and the diagnostic ambiguity at the tumor-vessel interface, which leads to substantial inter-rater variability even among expert radiologists. To address these limitations, we introduce the CURVAS-PDACVI Dataset and Challenge, an open benchmark for uncertainty-aware AI in PDAC staging based on a densely annotated dataset with five independent expert annotations per scan. We also propose a multi-metric evaluation framework that extends beyond spatial overlap to include probabilistic calibration and VI assessment. Evaluation of six state-of-the-art methods shows that strong global volumetric overlap does not necessarily translate into reliable performance at clinically critical tumor-vessel interfaces. In particular, methods optimized for binary segmentation perform competitively on average overlap metrics, but often degrade in high-complexity cases with low expert consensus, either collapsing in volume or overextending at uncertain boundaries. In contrast, methods that model inter-rater disagreement produce better calibrated probabilistic maps and show greater robustness in these ambiguous cases. The benchmark highlights the limitations of volumetric accuracy as a proxy for localized surgical utility, motivating uncertainty-aware probabilistic models for preoperative decision-making.