ChatPaper.aiChatPaper

Pillar-0: Новый рубеж для базовых моделей в радиологии

Pillar-0: A New Frontier for Radiology Foundation Models

November 21, 2025
Авторы: Kumar Krishna Agrawal, Longchao Liu, Long Lian, Michael Nercessian, Natalia Harguindeguy, Yufu Wu, Peter Mikhael, Gigin Lin, Lecia V. Sequist, Florian Fintelmann, Trevor Darrell, Yutong Bai, Maggie Chung, Adam Yala
cs.AI

Аннотация

Радиология играет ключевую роль в современной медицине, однако рост объемов визуализации значительно опередил увеличение числа специалистов. Фундаментальные модели предлагают путь к автоматизации всего спектра радиологических задач, но существующие медицинские модели остаются ограниченными: они обрабатывают объемные КТ и МРТ как низкокачественные 2D-срезы, отбрасывают критически важную информацию о градациях серого и не имеют оценочных框架, отражающих реальную клиническую практику. Мы представляем Pillar-0 — фундаментальную модель для радиологии, предварительно обученную на 42 990 КТ органов малого таза, 86 411 КТ грудной клетки, 14 348 КТ головы и 11 543 МРТ молочных желез из крупного академического центра, вместе с RATE — масштабируемой框架 для извлечения структурированных меток по 366 радиологическим находкам с почти идеальной точностью с использованием больших языковых моделей. На внутренних тестовых наборах из 14 230 КТ органов малого таза, 10 646 КТ грудной клетки, 4 906 КТ головы и 1 585 МРТ молочных желез Pillar-0 устанавливает новый рубеж производительности, достигая средних значений AUROC 86.4, 88.0, 90.1 и 82.9, превосходя MedGemma (Google), MedImageInsight (Microsoft), Lingshu (Alibaba) и Merlin (Stanford) на 7.8–15.8 пунктов AUROC и занимая первое место в 87.2% (319/366) задач. Pillar-0 аналогично превосходит все базовые модели при внешней валидации на наборе данных Stanford Abdominal CT, включая Merlin (82.2 против 80.6 AUROC). Pillar-0 расширяется на задачи за пределами предварительного обучения, такие как долгосрочное прогнозирование риска рака легких, где она улучшает state-of-the-art модель Sybil на 3.0 пункта C-index на NLST и обобщается с улучшениями на 5.9 (MGH) и 1.9 (CGMH). В задаче обнаружения кровоизлияний в мозг Pillar-0 достигла AUROC >95, используя лишь 1/20 данных от следующей наиболее эффективной по выборке базовой модели. Pillar-0 и RATE вместе представляют открытую, клинически строгую основу для построения высокопроизводительных радиологических систем, позволяя реализовывать приложения, ранее невозможные из-за вычислительных, данных и оценочных ограничений.
English
Radiology plays an integral role in modern medicine, yet rising imaging volumes have far outpaced workforce growth. Foundation models offer a path toward assisting with the full spectrum of radiology tasks, but existing medical models remain limited: they process volumetric CT and MRI as low-fidelity 2D slices, discard critical grayscale contrast information, and lack evaluation frameworks that reflect real clinical practice. We introduce Pillar-0, a radiology foundation model pretrained on 42,990 abdomen-pelvis CTs, 86,411 chest CTs, 14,348 head CTs, and 11,543 breast MRIs from a large academic center, together with RATE, a scalable framework that extracts structured labels for 366 radiologic findings with near-perfect accuracy using LLMs. Across internal test sets of 14,230 abdomen-pelvis CTs, 10,646 chest CTs, 4,906 head CTs, and 1,585 breast MRIs, Pillar-0 establishes a new performance frontier, achieving mean AUROCs of 86.4, 88.0, 90.1, and 82.9, outperforming MedGemma (Google), MedImageInsight (Microsoft), Lingshu (Alibaba), and Merlin (Stanford) by 7.8-15.8 AUROC points and ranking best in 87.2\% (319/366) tasks. Pillar-0 similarly outperforms all baselines in an external validation on the Stanford Abdominal CT dataset, including Merlin (82.2 vs 80.6 AUROC). Pillar-0 extends to tasks beyond its pretraining, such as long-horizon lung cancer risk prediction, where it improves upon the state-of-the-art Sybil by 3.0 C-index points on NLST, and generalizes with gains of 5.9 (MGH) and 1.9 (CGMH). In brain hemorrhage detection, Pillar-0 obtained a >95 AUROC when using only 1/20th of the data of the next most sample efficient baseline. Pillar-0 and RATE together provide an open, clinically rigorous foundation for building high-performance radiology systems, enabling applications that were previously infeasible due to computational, data, and evaluation constraints.
PDF222February 7, 2026