Curia: Un Modello Fondamentale Multi-Modale per la Radiologia
Curia: A Multi-Modal Foundation Model for Radiology
September 8, 2025
Autori: Corentin Dancette, Julien Khlaut, Antoine Saporta, Helene Philippe, Elodie Ferreres, Baptiste Callard, Théo Danielou, Léo Alberge, Léo Machado, Daniel Tordjman, Julie Dupuis, Korentin Le Floch, Jean Du Terrail, Mariam Moshiri, Laurent Dercle, Tom Boeken, Jules Gregory, Maxime Ronot, François Legou, Pascal Roux, Marc Sapoval, Pierre Manceron, Paul Hérent
cs.AI
Abstract
L'interpretazione radiologica assistita dall'IA si basa principalmente su modelli ristretti e specializzati in singoli compiti. Questo approccio risulta poco pratico per coprire l'ampio spettro di modalità di imaging, patologie e reperti radiologici. I modelli di base (Foundation Models, FMs) promettono una generalizzazione ampia tra diverse modalità e in contesti con dati limitati. Tuttavia, questo potenziale è rimasto largamente inespresso in radiologia. Presentiamo Curia, un modello di base addestrato sull'intera produzione di imaging trasversale di un importante ospedale nell'arco di diversi anni, che rappresenta, a nostra conoscenza, il più grande corpus di dati reali di questo tipo, comprendente 150.000 esami (130 TB). Su un nuovo benchmark di validazione esterna composto da 19 task, Curia identifica accuratamente gli organi, rileva condizioni come emorragie cerebrali e infarti miocardici e predice gli esiti nella stadiazione dei tumori. Curia eguaglia o supera le prestazioni dei radiologi e dei recenti modelli di base, dimostrando proprietà emergenti clinicamente significative in contesti cross-modalità e con dati limitati. Per accelerare il progresso, rilasciamo i pesi del nostro modello base su https://huggingface.co/raidium/curia.
English
AI-assisted radiological interpretation is based on predominantly narrow,
single-task models. This approach is impractical for covering the vast spectrum
of imaging modalities, diseases, and radiological findings. Foundation models
(FMs) hold the promise of broad generalization across modalities and in
low-data settings. However, this potential has remained largely unrealized in
radiology. We introduce Curia, a foundation model trained on the entire
cross-sectional imaging output of a major hospital over several years, which to
our knowledge is the largest such corpus of real-world data-encompassing
150,000 exams (130 TB). On a newly curated 19-task external validation
benchmark, Curia accurately identifies organs, detects conditions like brain
hemorrhages and myocardial infarctions, and predicts outcomes in tumor staging.
Curia meets or surpasses the performance of radiologists and recent foundation
models, and exhibits clinically significant emergent properties in
cross-modality, and low-data regimes. To accelerate progress, we release our
base model's weights at https://huggingface.co/raidium/curia.