Curia: Мультимодальная фундаментальная модель для радиологии
Curia: A Multi-Modal Foundation Model for Radiology
September 8, 2025
Авторы: Corentin Dancette, Julien Khlaut, Antoine Saporta, Helene Philippe, Elodie Ferreres, Baptiste Callard, Théo Danielou, Léo Alberge, Léo Machado, Daniel Tordjman, Julie Dupuis, Korentin Le Floch, Jean Du Terrail, Mariam Moshiri, Laurent Dercle, Tom Boeken, Jules Gregory, Maxime Ronot, François Legou, Pascal Roux, Marc Sapoval, Pierre Manceron, Paul Hérent
cs.AI
Аннотация
Интерпретация радиологических данных с помощью ИИ в основном основана на узкоспециализированных моделях, решающих одну задачу. Такой подход непрактичен для охвата широкого спектра методов визуализации, заболеваний и радиологических находок. Фундаментальные модели (ФМ) обещают широкую обобщаемость в различных модальностях и в условиях ограниченных данных. Однако этот потенциал в радиологии остается в значительной степени нереализованным. Мы представляем Curia — фундаментальную модель, обученную на всем объеме данных кросс-секционной визуализации крупной больницы за несколько лет, что, насколько нам известно, является крупнейшим корпусом реальных данных такого рода, охватывающим 150 000 исследований (130 ТБ). На новом внешнем валидационном тесте, включающем 19 задач, Curia точно идентифицирует органы, обнаруживает такие состояния, как кровоизлияния в мозг и инфаркты миокарда, и прогнозирует исходы при стадировании опухолей. Curia соответствует или превосходит результаты радиологов и современных фундаментальных моделей, а также демонстрирует клинически значимые эмерджентные свойства в кросс-модальных и низкоданных режимах. Чтобы ускорить прогресс, мы публикуем веса нашей базовой модели по адресу https://huggingface.co/raidium/curia.
English
AI-assisted radiological interpretation is based on predominantly narrow,
single-task models. This approach is impractical for covering the vast spectrum
of imaging modalities, diseases, and radiological findings. Foundation models
(FMs) hold the promise of broad generalization across modalities and in
low-data settings. However, this potential has remained largely unrealized in
radiology. We introduce Curia, a foundation model trained on the entire
cross-sectional imaging output of a major hospital over several years, which to
our knowledge is the largest such corpus of real-world data-encompassing
150,000 exams (130 TB). On a newly curated 19-task external validation
benchmark, Curia accurately identifies organs, detects conditions like brain
hemorrhages and myocardial infarctions, and predicts outcomes in tumor staging.
Curia meets or surpasses the performance of radiologists and recent foundation
models, and exhibits clinically significant emergent properties in
cross-modality, and low-data regimes. To accelerate progress, we release our
base model's weights at https://huggingface.co/raidium/curia.