ChatPaper.aiChatPaper

Pillar-0: Una Nuova Frontiera per i Modelli di Base in Radiologia

Pillar-0: A New Frontier for Radiology Foundation Models

November 21, 2025
Autori: Kumar Krishna Agrawal, Longchao Liu, Long Lian, Michael Nercessian, Natalia Harguindeguy, Yufu Wu, Peter Mikhael, Gigin Lin, Lecia V. Sequist, Florian Fintelmann, Trevor Darrell, Yutong Bai, Maggie Chung, Adam Yala
cs.AI

Abstract

La radiologia svolge un ruolo integrale nella medicina moderna, ma il crescente volume di imaging ha superato di gran lunga l'aumento della forza lavoro. I modelli fondazionali offrono una strada verso l'assistenza nell'intero spettro dei compiti radiologici, ma i modelli medici esistenti rimangono limitati: elaborano le TC e le risonanze magnetiche volumetriche come sezioni 2D a bassa fedeltà, scartano le fondamentali informazioni sul contrasto in scala di grigi e mancano di framework di valutazione che riflettano la pratica clinica reale. Presentiamo Pillar-0, un modello fondazionale per la radiologia pre-addestrato su 42.990 TC addome-pelvi, 86.411 TC del torace, 14.348 TC cranio e 11.543 risonanze magnetiche mammarie provenienti da un grande centro accademico, insieme a RATE, un framework scalabile che estrae etichette strutturate per 366 reperti radiologici con un'accuratezza quasi perfetta utilizzando LLM. Su set di test interni di 14.230 TC addome-pelvi, 10.646 TC del torace, 4.906 TC cranio e 1.585 risonanze magnetiche mammarie, Pillar-0 stabilisce una nuova frontiera delle prestazioni, raggiungendo AUROC medi dell'86,4, 88,0, 90,1 e 82,9, superando MedGemma (Google), MedImageInsight (Microsoft), Lingshu (Alibaba) e Merlin (Stanford) di 7,8-15,8 punti AUROC e classificandosi al primo posto nell'87,2% (319/366) dei compiti. Pillar-0 supera similamente tutti i baseline in una validazione esterna sul dataset Stanford Abdominal CT, incluso Merlin (82,2 vs 80,6 AUROC). Pillar-0 si estende a compiti oltre il suo pre-addestramento, come la previsione del rischio di cancro al polmone a lungo termine, dove migliora lo stato dell'arte Sybil di 3,0 punti C-index su NLST, e generalizza con guadagni di 5,9 (MGH) e 1,9 (CGMH). Nel rilevamento dell'emorragia cerebrale, Pillar-0 ha ottenuto un AUROC >95 utilizzando solo 1/20 dei dati del baseline successivo più efficiente in termini di campionamento. Pillar-0 e RATE insieme forniscono una base aperta e clinicamente rigorosa per costruire sistemi radiologici ad alte prestazioni, abilitando applicazioni precedentemente irrealizzabili a causa di vincoli computazionali, di dati e di valutazione.
English
Radiology plays an integral role in modern medicine, yet rising imaging volumes have far outpaced workforce growth. Foundation models offer a path toward assisting with the full spectrum of radiology tasks, but existing medical models remain limited: they process volumetric CT and MRI as low-fidelity 2D slices, discard critical grayscale contrast information, and lack evaluation frameworks that reflect real clinical practice. We introduce Pillar-0, a radiology foundation model pretrained on 42,990 abdomen-pelvis CTs, 86,411 chest CTs, 14,348 head CTs, and 11,543 breast MRIs from a large academic center, together with RATE, a scalable framework that extracts structured labels for 366 radiologic findings with near-perfect accuracy using LLMs. Across internal test sets of 14,230 abdomen-pelvis CTs, 10,646 chest CTs, 4,906 head CTs, and 1,585 breast MRIs, Pillar-0 establishes a new performance frontier, achieving mean AUROCs of 86.4, 88.0, 90.1, and 82.9, outperforming MedGemma (Google), MedImageInsight (Microsoft), Lingshu (Alibaba), and Merlin (Stanford) by 7.8-15.8 AUROC points and ranking best in 87.2\% (319/366) tasks. Pillar-0 similarly outperforms all baselines in an external validation on the Stanford Abdominal CT dataset, including Merlin (82.2 vs 80.6 AUROC). Pillar-0 extends to tasks beyond its pretraining, such as long-horizon lung cancer risk prediction, where it improves upon the state-of-the-art Sybil by 3.0 C-index points on NLST, and generalizes with gains of 5.9 (MGH) and 1.9 (CGMH). In brain hemorrhage detection, Pillar-0 obtained a >95 AUROC when using only 1/20th of the data of the next most sample efficient baseline. Pillar-0 and RATE together provide an open, clinically rigorous foundation for building high-performance radiology systems, enabling applications that were previously infeasible due to computational, data, and evaluation constraints.
PDF192December 3, 2025