Verso un Intelligenza Artificiale Medica Scientifica

Abstract

I sistemi autonomi in grado di generare ipotesi scientifiche, condurre esperimenti e redigere manoscritti sono recentemente emersi come un paradigma promettente per accelerare la scoperta scientifica. Tuttavia, gli attuali Scienziati IA rimangono largamente dominio-agnostici, limitando la loro applicabilità alla medicina clinica, dove la ricerca richiede di essere fondata su evidenze mediche con modalità dati specializzate. In questo lavoro, introduciamo Medical AI Scientist, il primo framework di ricerca autonomo specificamente progettato per la ricerca clinica autonoma. Esso abilita un'ideazione clinicamente fondata trasformando la letteratura ampiamente esaminata in evidenze attuabili attraverso un meccanismo di co-ragionamento clinico-ingegneristico, che migliora la tracciabilità delle idee di ricerca generate. Inoltre, facilita la stesura di manoscritti basati su evidenze guidata da convenzioni compositive mediche strutturate e politiche etiche. Il framework opera secondo 3 modalità di ricerca: riproduzione basata su articoli, innovazione ispirata dalla letteratura ed esplorazione guidata da compiti, ciascuna corrispondente a un livello distinto di indagine scientifica automatizzata con autonomia progressivamente crescente. Valutazioni complete condotte sia da grandi modelli linguistici che da esperti umani dimostrano che le idee generate dal Medical AI Scientist sono di qualità sostanzialmente superiore rispetto a quelle prodotte da LLM commerciali attraverso 171 casi, 19 compiti clinici e 6 modalità dati. Nel frattempo, il nostro sistema raggiunge una forte coerenza tra il metodo proposto e la sua implementazione, dimostrando anche tassi di successo significativamente più elevati negli esperimenti eseguibili. Valutazioni in doppio cieco da parte di esperti umani e dello Stanford Agentic Reviewer suggeriscono che i manoscritti generati si avvicinano alla qualità di livello MICCAI, superando costantemente quelli provenienti da ISBI e BIBM. Il Medical AI Scientist proposto evidenzia il potenziale dello sfruttamento dell'IA per la scoperta scientifica autonoma in ambito sanitario.

English

Autonomous systems that generate scientific hypotheses, conduct experiments, and draft manuscripts have recently emerged as a promising paradigm for accelerating discovery. However, existing AI Scientists remain largely domain-agnostic, limiting their applicability to clinical medicine, where research is required to be grounded in medical evidence with specialized data modalities. In this work, we introduce Medical AI Scientist, the first autonomous research framework tailored to clinical autonomous research. It enables clinically grounded ideation by transforming extensively surveyed literature into actionable evidence through clinician-engineer co-reasoning mechanism, which improves the traceability of generated research ideas. It further facilitates evidence-grounded manuscript drafting guided by structured medical compositional conventions and ethical policies. The framework operates under 3 research modes, namely paper-based reproduction, literature-inspired innovation, and task-driven exploration, each corresponding to a distinct level of automated scientific inquiry with progressively increasing autonomy. Comprehensive evaluations by both large language models and human experts demonstrate that the ideas generated by the Medical AI Scientist are of substantially higher quality than those produced by commercial LLMs across 171 cases, 19 clinical tasks, and 6 data modalities. Meanwhile, our system achieves strong alignment between the proposed method and its implementation, while also demonstrating significantly higher success rates in executable experiments. Double-blind evaluations by human experts and the Stanford Agentic Reviewer suggest that the generated manuscripts approach MICCAI-level quality, while consistently surpassing those from ISBI and BIBM. The proposed Medical AI Scientist highlights the potential of leveraging AI for autonomous scientific discovery in healthcare.

Verso un Intelligenza Artificiale Medica Scientifica

Towards a Medical AI Scientist

Abstract

Support