ChatPaper.aiChatPaper

Оценка сосудистой инвазии при протоковой аденокарциноме поджелудочной железы: эталонный тест PDACVI

Assessing Pancreatic Ductal Adenocarcinoma Vascular Invasion: the PDACVI Benchmark

April 30, 2026
Авторы: M. Riera-Marín, O. K. Sikha, J. Rodríguez-Comas, M. S. May, T. Kirscher, X. Coubez, P. Meyer, S. Faisan, Z. Pan, X. Zhou, X. Liang, C. Hémon, V. Boussot, J. -L. Dillenseger, J. -C. Nunes, K. -C. Kahl, C. Lüth, J. Traub, P. -H. Conze, M. M. Duh, A. Aubanell, R. de Figueiredo Cardoso, S. Egger-Hackenschmidt, J. García-López, M. A. González-Ballester, A. Galdran
cs.AI

Аннотация

Хирургическая резекция остается единственным потенциально радикальным методом лечения протоковой аденокарциномы поджелудочной железы (ПАПЖ), а возможность ее выполнения зависит от точной оценки сосудистой инвазии (СИ), то есть распространения опухоли на прилегающие критические сосуды. Несмотря на важность для предоперационного стадирования и планирования операции, компьютерная оценка СИ остается малоизученной. Две основные проблемы — это отсутствие общедоступных наборов данных и диагностическая неоднозначность на границе опухоли и сосуда, что приводит к значительной вариабельности оценок даже среди опытных рентгенологов. Для преодоления этих ограничений мы представляем CURVAS-PDACVI Dataset and Challenge — открытый эталонный набор для оценки AI с учетом неопределенности при стадировании ПАПЖ, основанный на плотно размеченном наборе данных с пятью независимыми экспертными оценками для каждого скана. Мы также предлагаем многокритериальную систему оценки, которая выходит за рамки пространственного перекрытия и включает вероятностную калибровку и оценку СИ. Оценка шести современных методов показывает, что высокое глобальное объемное перекрытие не обязательно обеспечивает надежную работу на клинически критичных границах опухоли и сосуда. В частности, методы, оптимизированные для бинарной сегментации, показывают конкурентоспособные результаты по метрикам среднего перекрытия, но часто демонстрируют ухудшение в сложных случаях с низким согласием экспертов — либо значительно сокращая объем, либо чрезмерно расширяясь на неопределенных границах. В отличие от них, методы, моделирующие междоценочную вариабельность, создают лучше калиброванные вероятностные карты и проявляют большую устойчивость в этих неоднозначных ситуациях. Бенчмарк выявляет ограничения объемной точности как показателя локальной хирургической применимости, обосновывая необходимость вероятностных моделей с учетом неопределенности для поддержки предоперационного принятия решений.
English
Surgical resection remains the only potentially curative treatment for pancreatic ductal adenocarcinoma (PDAC), and eligibility depends on accurate assessment of vascular invasion (VI), i.e., tumor extension into adjacent critical vessels. Despite its importance for preoperative staging and surgical planning, computational VI assessment remains underexplored. Two major challenges are the lack of public datasets and the diagnostic ambiguity at the tumor-vessel interface, which leads to substantial inter-rater variability even among expert radiologists. To address these limitations, we introduce the CURVAS-PDACVI Dataset and Challenge, an open benchmark for uncertainty-aware AI in PDAC staging based on a densely annotated dataset with five independent expert annotations per scan. We also propose a multi-metric evaluation framework that extends beyond spatial overlap to include probabilistic calibration and VI assessment. Evaluation of six state-of-the-art methods shows that strong global volumetric overlap does not necessarily translate into reliable performance at clinically critical tumor-vessel interfaces. In particular, methods optimized for binary segmentation perform competitively on average overlap metrics, but often degrade in high-complexity cases with low expert consensus, either collapsing in volume or overextending at uncertain boundaries. In contrast, methods that model inter-rater disagreement produce better calibrated probabilistic maps and show greater robustness in these ambiguous cases. The benchmark highlights the limitations of volumetric accuracy as a proxy for localized surgical utility, motivating uncertainty-aware probabilistic models for preoperative decision-making.
PDF11May 6, 2026