Auf dem Weg zu einem medizinischen KI-Wissenschaftler
Towards a Medical AI Scientist
March 30, 2026
Autoren: Hongtao Wu, Boyun Zheng, Dingjie Song, Yu Jiang, Jianfeng Gao, Lei Xing, Lichao Sun, Yixuan Yuan
cs.AI
Zusammenfassung
Autonome Systeme, die wissenschaftliche Hypothesen generieren, Experimente durchführen und Manuskripte verfassen, sind kürzlich als vielversprechendes Paradigma zur Beschleunigung von Entdeckungen aufgetaucht. Bisherige KI-Wissenschaftler sind jedoch weitgehend domänenunabhängig, was ihre Anwendbarkeit in der klinischen Medizin einschränkt, wo Forschung auf medizinischer Evidenz mit spezialisierten Datenmodalitäten basieren muss. In dieser Arbeit stellen wir den Medical AI Scientist vor, den ersten autonomen Forschungsrahmen, der speziell für die klinische autonome Forschung entwickelt wurde. Er ermöglicht klinisch fundierte Ideenfindung, indem umfassend gesichtete Literatur durch einen klinisch-technischen Co-Reasoning-Mechanismus in handlungsorientierte Evidenz umgewandelt wird, was die Nachverfolgbarkeit der generierten Forschungsansätze verbessert. Darüber hinaus erleichtert er die evidenzbasierte Manuskripterstellung, die von strukturierten medizinischen Kompositionskonventionen und ethischen Richtlinien geleitet wird. Das Framework operiert in drei Forschungsmodi: papierbasierte Reproduktion, literaturinspirierte Innovation und aufgabengetriebene Exploration, die jeweils einem unterschiedlichen Grad an automatisiertem wissenschaftlichem Erkenntnisgewinn mit zunehmender Autonomie entsprechen. Umfassende Evaluierungen durch große Sprachmodelle und menschliche Experten zeigen, dass die vom Medical AI Scientist generierten Ideen in 171 Fällen, 19 klinischen Aufgaben und 6 Datenmodalitäten eine wesentlich höhere Qualität aufweisen als die von kommerziellen LLMs. Unser System erreicht zudem eine hohe Übereinstimmung zwischen der vorgeschlagenen Methode und ihrer Implementierung und weist gleichzeitig signifikant höhere Erfolgsquoten bei ausführbaren Experimenten auf. Doppelblinde Bewertungen durch menschliche Experten und den Stanford Agentic Reviewer deuten darauf hin, dass die generierten Manuskripte MICCAI-Qualität erreichen und durchgängig besser abschneiden als solche von ISBI und BIBM. Der vorgeschlagene Medical AI Scientist unterstreicht das Potenzial von KI für autonome wissenschaftliche Entdeckungen im Gesundheitswesen.
English
Autonomous systems that generate scientific hypotheses, conduct experiments, and draft manuscripts have recently emerged as a promising paradigm for accelerating discovery. However, existing AI Scientists remain largely domain-agnostic, limiting their applicability to clinical medicine, where research is required to be grounded in medical evidence with specialized data modalities. In this work, we introduce Medical AI Scientist, the first autonomous research framework tailored to clinical autonomous research. It enables clinically grounded ideation by transforming extensively surveyed literature into actionable evidence through clinician-engineer co-reasoning mechanism, which improves the traceability of generated research ideas. It further facilitates evidence-grounded manuscript drafting guided by structured medical compositional conventions and ethical policies. The framework operates under 3 research modes, namely paper-based reproduction, literature-inspired innovation, and task-driven exploration, each corresponding to a distinct level of automated scientific inquiry with progressively increasing autonomy. Comprehensive evaluations by both large language models and human experts demonstrate that the ideas generated by the Medical AI Scientist are of substantially higher quality than those produced by commercial LLMs across 171 cases, 19 clinical tasks, and 6 data modalities. Meanwhile, our system achieves strong alignment between the proposed method and its implementation, while also demonstrating significantly higher success rates in executable experiments. Double-blind evaluations by human experts and the Stanford Agentic Reviewer suggest that the generated manuscripts approach MICCAI-level quality, while consistently surpassing those from ISBI and BIBM. The proposed Medical AI Scientist highlights the potential of leveraging AI for autonomous scientific discovery in healthcare.