ChatPaper.aiChatPaper

Vers un scientifique de l'intelligence artificielle médicale

Towards a Medical AI Scientist

March 30, 2026
Auteurs: Hongtao Wu, Boyun Zheng, Dingjie Song, Yu Jiang, Jianfeng Gao, Lei Xing, Lichao Sun, Yixuan Yuan
cs.AI

Résumé

Les systèmes autonomes capables de générer des hypothèses scientifiques, de mener des expériences et de rédiger des manuscrits sont récemment apparus comme un paradigme prometteur pour accélérer les découvertes. Cependant, les scientifiques IA existants restent largement agnostiques au domaine, limitant leur applicabilité à la médecine clinique, où la recherche doit s'appuyer sur des preuves médicales avec des modalités de données spécialisées. Dans ce travail, nous présentons Medical AI Scientist, le premier cadre de recherche autonome conçu spécifiquement pour la recherche clinique autonome. Il permet une idéation cliniquement fondée en transformant la littérature minutieusement examinée en preuves actionnables grâce à un mécanisme de co-raisonnement clinicien-ingénieur, qui améliore la traçabilité des idées de recherche générées. Il facilite en outre la rédaction de manuscrits fondés sur des preuves, guidée par des conventions structurelles de composition médicale et des politiques éthiques. Le cadre opère selon 3 modes de recherche : la reproduction basée sur des articles, l'innovation inspirée par la littérature et l'exploration dirigée par des tâches, chacun correspondant à un niveau distinct d'investigation scientifique automatisée avec une autonomie croissante. Des évaluations complètes par des grands modèles de langage et des experts humains démontrent que les idées générées par le Medical AI Scientist sont de qualité substantiellement supérieure à celles produites par des LLM commerciaux sur 171 cas, 19 tâches cliniques et 6 modalités de données. Parallèlement, notre système atteint une forte adéquation entre la méthode proposée et son implémentation, tout en affichant des taux de réussite significativement plus élevés dans les expériences exécutables. Des évaluations en double aveugle par des experts humains et le Stanford Agentic Reviewer indiquent que les manuscrits générés approchent la qualité des publications MICCAI, tout en dépassant systématiquement ceux des conférences ISBI et BIBM. Le Medical AI Scientist proposé souligne le potentiel de l'exploitation de l'IA pour la découverte scientifique autonome dans le domaine de la santé.
English
Autonomous systems that generate scientific hypotheses, conduct experiments, and draft manuscripts have recently emerged as a promising paradigm for accelerating discovery. However, existing AI Scientists remain largely domain-agnostic, limiting their applicability to clinical medicine, where research is required to be grounded in medical evidence with specialized data modalities. In this work, we introduce Medical AI Scientist, the first autonomous research framework tailored to clinical autonomous research. It enables clinically grounded ideation by transforming extensively surveyed literature into actionable evidence through clinician-engineer co-reasoning mechanism, which improves the traceability of generated research ideas. It further facilitates evidence-grounded manuscript drafting guided by structured medical compositional conventions and ethical policies. The framework operates under 3 research modes, namely paper-based reproduction, literature-inspired innovation, and task-driven exploration, each corresponding to a distinct level of automated scientific inquiry with progressively increasing autonomy. Comprehensive evaluations by both large language models and human experts demonstrate that the ideas generated by the Medical AI Scientist are of substantially higher quality than those produced by commercial LLMs across 171 cases, 19 clinical tasks, and 6 data modalities. Meanwhile, our system achieves strong alignment between the proposed method and its implementation, while also demonstrating significantly higher success rates in executable experiments. Double-blind evaluations by human experts and the Stanford Agentic Reviewer suggest that the generated manuscripts approach MICCAI-level quality, while consistently surpassing those from ISBI and BIBM. The proposed Medical AI Scientist highlights the potential of leveraging AI for autonomous scientific discovery in healthcare.
PDF641April 1, 2026