Op weg naar een medische AI-wetenschapper
Towards a Medical AI Scientist
March 30, 2026
Auteurs: Hongtao Wu, Boyun Zheng, Dingjie Song, Yu Jiang, Jianfeng Gao, Lei Xing, Lichao Sun, Yixuan Yuan
cs.AI
Samenvatting
Autonome systemen die wetenschappelijke hypothesen genereren, experimenten uitvoeren en manuscripten opstellen zijn recent naar voren gekomen als een veelbelovend paradigma om ontdekkingen te versnellen. Echter, bestaande AI-wetenschappers zijn grotendeels domein-agnostisch, wat hun toepasbaarheid beperkt voor de klinische geneeskunde, waar onderzoek moet zijn gebaseerd op medisch bewijs met gespecialiseerde datamodaliteiten. In dit werk introduceren we Medical AI Scientist, het eerste autonome onderzoeksraamwerk dat is toegesneden op klinisch autonoom onderzoek. Het maakt klinisch onderbouwde ideeënvorming mogelijk door uitgebreid bestudeerde literatuur om te zetten in bruikbaar bewijs via een klinicus-ingenieur co-reasoning mechanisme, wat de traceerbaarheid van gegenereerde onderzoeksideeën verbetert. Het vergemakkelijkt verder het opstellen van manuscripten die evidence-based zijn en worden geleid door gestructureerde medische compositieconventies en ethische beleidsregels. Het raamwerk opereert volgens 3 onderzoeksmodi, namelijk op papier gebaseerde reproductie, door literatuur geïnspireerde innovatie, en taakgedreven exploratie, elk corresponderend met een distinct niveau van geautomatiseerd wetenschappelijk onderzoek met progressief toenemende autonomie. Uitgebreide evaluaties door zowel grote taalmodellen als menselijke experts tonen aan dat de ideeën gegenereerd door de Medical AI Scientist van aanzienlijk hogere kwaliteit zijn dan die geproduceerd door commerciële LLM's, gebaseerd op 171 casussen, 19 klinische taken en 6 datamodaliteiten. Tegelijkertijd bereikt ons systeem een sterke alignering tussen de voorgestelde methode en de implementatie ervan, en laat het significant hogere slagingspercentages zien in uitvoerbare experimenten. Dubbelblinde evaluaties door menselijke experts en de Stanford Agentic Reviewer suggereren dat de gegenereerde manuscripten MICCAI-kwaliteit benaderen, terwijl ze consistent die van ISBI en BIBM overtreffen. De voorgestelde Medical AI Scientist benadrukt het potentieel van het inzetten van AI voor autonome wetenschappelijke ontdekkingen in de gezondheidszorg.
English
Autonomous systems that generate scientific hypotheses, conduct experiments, and draft manuscripts have recently emerged as a promising paradigm for accelerating discovery. However, existing AI Scientists remain largely domain-agnostic, limiting their applicability to clinical medicine, where research is required to be grounded in medical evidence with specialized data modalities. In this work, we introduce Medical AI Scientist, the first autonomous research framework tailored to clinical autonomous research. It enables clinically grounded ideation by transforming extensively surveyed literature into actionable evidence through clinician-engineer co-reasoning mechanism, which improves the traceability of generated research ideas. It further facilitates evidence-grounded manuscript drafting guided by structured medical compositional conventions and ethical policies. The framework operates under 3 research modes, namely paper-based reproduction, literature-inspired innovation, and task-driven exploration, each corresponding to a distinct level of automated scientific inquiry with progressively increasing autonomy. Comprehensive evaluations by both large language models and human experts demonstrate that the ideas generated by the Medical AI Scientist are of substantially higher quality than those produced by commercial LLMs across 171 cases, 19 clinical tasks, and 6 data modalities. Meanwhile, our system achieves strong alignment between the proposed method and its implementation, while also demonstrating significantly higher success rates in executable experiments. Double-blind evaluations by human experts and the Stanford Agentic Reviewer suggest that the generated manuscripts approach MICCAI-level quality, while consistently surpassing those from ISBI and BIBM. The proposed Medical AI Scientist highlights the potential of leveraging AI for autonomous scientific discovery in healthcare.