Curia: Un Modelo Fundacional Multimodal para Radiología
Curia: A Multi-Modal Foundation Model for Radiology
September 8, 2025
Autores: Corentin Dancette, Julien Khlaut, Antoine Saporta, Helene Philippe, Elodie Ferreres, Baptiste Callard, Théo Danielou, Léo Alberge, Léo Machado, Daniel Tordjman, Julie Dupuis, Korentin Le Floch, Jean Du Terrail, Mariam Moshiri, Laurent Dercle, Tom Boeken, Jules Gregory, Maxime Ronot, François Legou, Pascal Roux, Marc Sapoval, Pierre Manceron, Paul Hérent
cs.AI
Resumen
La interpretación radiológica asistida por IA se basa principalmente en modelos estrechos y de tarea única. Este enfoque resulta poco práctico para abarcar el amplio espectro de modalidades de imagen, enfermedades y hallazgos radiológicos. Los modelos fundamentales (FMs) prometen una generalización amplia entre modalidades y en entornos con pocos datos. Sin embargo, este potencial ha permanecido en gran medida sin realizarse en radiología. Presentamos Curia, un modelo fundamental entrenado en toda la producción de imágenes transversales de un hospital importante durante varios años, que, hasta donde sabemos, es el mayor corpus de datos del mundo real de este tipo, abarcando 150,000 exámenes (130 TB). En un nuevo punto de referencia de validación externa de 19 tareas, Curia identifica con precisión órganos, detecta condiciones como hemorragias cerebrales e infartos de miocardio, y predice resultados en la estadificación de tumores. Curia iguala o supera el rendimiento de radiólogos y modelos fundamentales recientes, y exhibe propiedades emergentes clínicamente significativas en regímenes de baja cantidad de datos y entre modalidades. Para acelerar el progreso, publicamos los pesos de nuestro modelo base en https://huggingface.co/raidium/curia.
English
AI-assisted radiological interpretation is based on predominantly narrow,
single-task models. This approach is impractical for covering the vast spectrum
of imaging modalities, diseases, and radiological findings. Foundation models
(FMs) hold the promise of broad generalization across modalities and in
low-data settings. However, this potential has remained largely unrealized in
radiology. We introduce Curia, a foundation model trained on the entire
cross-sectional imaging output of a major hospital over several years, which to
our knowledge is the largest such corpus of real-world data-encompassing
150,000 exams (130 TB). On a newly curated 19-task external validation
benchmark, Curia accurately identifies organs, detects conditions like brain
hemorrhages and myocardial infarctions, and predicts outcomes in tumor staging.
Curia meets or surpasses the performance of radiologists and recent foundation
models, and exhibits clinically significant emergent properties in
cross-modality, and low-data regimes. To accelerate progress, we release our
base model's weights at https://huggingface.co/raidium/curia.