ChatPaper.aiChatPaper

Pillar-0 : Une nouvelle frontière pour les modèles fondateurs en radiologie

Pillar-0: A New Frontier for Radiology Foundation Models

November 21, 2025
papers.authors: Kumar Krishna Agrawal, Longchao Liu, Long Lian, Michael Nercessian, Natalia Harguindeguy, Yufu Wu, Peter Mikhael, Gigin Lin, Lecia V. Sequist, Florian Fintelmann, Trevor Darrell, Yutong Bai, Maggie Chung, Adam Yala
cs.AI

papers.abstract

La radiologie joue un rôle essentiel dans la médecine moderne, mais l'augmentation des volumes d'imagerie a largement dépassé la croissance de la main-d'œuvre. Les modèles de fondation offrent une voie pour assister l'ensemble des tâches radiologiques, mais les modèles médicaux existants restent limités : ils traitent la tomodensitométrie (TDM) et l'imagerie par résonance magnétique (IRM) volumétriques comme des coupes 2D basse fidélité, ignorent les informations critiques de contraste en niveaux de gris et manquent de cadres d'évaluation reflétant la pratique clinique réelle. Nous présentons Pillar-0, un modèle de fondation pour la radiologie pré-entraîné sur 42 990 TDM abdomino-pelviennes, 86 411 TDM thoraciques, 14 348 TDM crâniennes et 11 543 IRM mammaires provenant d'un grand centre académique, ainsi que RATE, un cadre évolutif qui extrait des étiquettes structurées pour 366 observations radiologiques avec une précision quasi parfaite en utilisant des LLM. Sur des ensembles de tests internes de 14 230 TDM abdomino-pelviennes, 10 646 TDM thoraciques, 4 906 TDM crâniennes et 1 585 IRM mammaires, Pillar-0 établit une nouvelle frontière de performance, atteignant des AUROC moyens de 86,4, 88,0, 90,1 et 82,9, surpassant MedGemma (Google), MedImageInsight (Microsoft), Lingshu (Alibaba) et Merlin (Stanford) de 7,8 à 15,8 points d'AUROC et se classant premier dans 87,2 % (319/366) des tâches. Pillar-0 surpasse également toutes les méthodes de référence dans une validation externe sur le jeu de données Stanford Abdominal CT, incluant Merlin (82,2 contre 80,6 d'AUROC). Pillar-0 s'étend à des tâches au-delà de son pré-entraînement, comme la prédiction du risque à long terme du cancer du poumon, où il améliore l'état de l'art Sybil de 3,0 points d'indice C sur NLST, et se généralise avec des gains de 5,9 (MGH) et 1,9 (CGMH). Pour la détection d'hémorragie cérébrale, Pillar-0 a obtenu un AUROC >95 en n'utilisant qu'un vingtième des données nécessaires à la méthode de référence la plus efficace en échantillons suivante. Pillar-0 et RATE fournissent ensemble une base ouverte et cliniquement rigoureuse pour construire des systèmes de radiologie haute performance, permettant des applications auparavant impossibles en raison des contraintes de calcul, de données et d'évaluation.
English
Radiology plays an integral role in modern medicine, yet rising imaging volumes have far outpaced workforce growth. Foundation models offer a path toward assisting with the full spectrum of radiology tasks, but existing medical models remain limited: they process volumetric CT and MRI as low-fidelity 2D slices, discard critical grayscale contrast information, and lack evaluation frameworks that reflect real clinical practice. We introduce Pillar-0, a radiology foundation model pretrained on 42,990 abdomen-pelvis CTs, 86,411 chest CTs, 14,348 head CTs, and 11,543 breast MRIs from a large academic center, together with RATE, a scalable framework that extracts structured labels for 366 radiologic findings with near-perfect accuracy using LLMs. Across internal test sets of 14,230 abdomen-pelvis CTs, 10,646 chest CTs, 4,906 head CTs, and 1,585 breast MRIs, Pillar-0 establishes a new performance frontier, achieving mean AUROCs of 86.4, 88.0, 90.1, and 82.9, outperforming MedGemma (Google), MedImageInsight (Microsoft), Lingshu (Alibaba), and Merlin (Stanford) by 7.8-15.8 AUROC points and ranking best in 87.2\% (319/366) tasks. Pillar-0 similarly outperforms all baselines in an external validation on the Stanford Abdominal CT dataset, including Merlin (82.2 vs 80.6 AUROC). Pillar-0 extends to tasks beyond its pretraining, such as long-horizon lung cancer risk prediction, where it improves upon the state-of-the-art Sybil by 3.0 C-index points on NLST, and generalizes with gains of 5.9 (MGH) and 1.9 (CGMH). In brain hemorrhage detection, Pillar-0 obtained a >95 AUROC when using only 1/20th of the data of the next most sample efficient baseline. Pillar-0 and RATE together provide an open, clinically rigorous foundation for building high-performance radiology systems, enabling applications that were previously infeasible due to computational, data, and evaluation constraints.
PDF222February 7, 2026