EvoScientist : Vers des scientifiques IA multi-agents évolutifs pour la découverte scientifique de bout en bout
EvoScientist: Towards Multi-Agent Evolving AI Scientists for End-to-End Scientific Discovery
March 9, 2026
Auteurs: Yougang Lyu, Xi Zhang, Xinhao Yi, Yuyue Zhao, Shuyu Guo, Wenxiang Hu, Jan Piotrowski, Jakub Kaliski, Jacopo Urbani, Zaiqiao Meng, Lun Zhou, Xiaohui Yan
cs.AI
Résumé
L'adoption croissante des modèles de langage à grande échelle (LLM) permet aux scientifiques en IA d'effectuer des tâches complexes de découverte scientifique de bout en bout, nécessitant la coordination de rôles spécialisés, incluant la génération d'idées et l'exécution expérimentale. Cependant, la plupart des systèmes de scientifiques en IA à la pointe reposent sur des pipelines statiques et conçus manuellement, et ne parviennent pas à s'adapter en fonction des historiques d'interaction accumulés. Par conséquent, ces systèmes négligent des axes de recherche prometteurs, répètent les expériences ayant échoué et poursuivent des idées irréalisables. Pour remédier à cela, nous présentons EvoScientist, un cadre évolutif de scientifique en IA multi-agents qui améliore continuellement les stratégies de recherche grâce à une mémoire persistante et à une auto-évolution. EvoScientist comprend trois agents spécialisés : un Agent Chercheur (RA) pour la génération d'idées scientifiques, un Agent Ingénieur (EA) pour la mise en œuvre et l'exécution des expériences, et un Agent Gestionnaire de l'Évolution (EMA) qui distille les enseignements des interactions passées en connaissances réutilisables. EvoScientist contient deux modules de mémoire persistante : (i) une mémoire d'idéation, qui résume les axes de recherche réalisables à partir des idées les mieux classées tout en enregistrant les directions précédemment infructueuses ; et (ii) une mémoire d'expérimentation, qui capture les stratégies efficaces de traitement des données et d'entraînement des modèles dérivées des trajectoires de recherche de code et des implémentations les plus performantes. Ces modules permettent au RA et à l'EA de récupérer les stratégies antérieures pertinentes, améliorant ainsi la qualité des idées et les taux de réussite de l'exécution du code au fil du temps. Les expériences montrent qu'EvoScientist surpasse 7 systèmes open-source et commerciaux à la pointe dans la génération d'idées scientifiques, obtenant une plus grande nouveauté, faisabilité, pertinence et clarté via une évaluation automatique et humaine. EvoScientist améliore également considérablement les taux de réussite de l'exécution du code grâce à l'évolution multi-agents, démontrant l'efficacité de la mémoire persistante pour la découverte scientifique de bout en bout.
English
The increasing adoption of Large Language Models (LLMs) has enabled AI scientists to perform complex end-to-end scientific discovery tasks requiring coordination of specialized roles, including idea generation and experimental execution. However, most state-of-the-art AI scientist systems rely on static, hand-designed pipelines and fail to adapt based on accumulated interaction histories. As a result, these systems overlook promising research directions, repeat failed experiments, and pursue infeasible ideas. To address this, we introduce EvoScientist, an evolving multi-agent AI scientist framework that continuously improves research strategies through persistent memory and self-evolution. EvoScientist comprises three specialized agents: a Researcher Agent (RA) for scientific idea generation, an Engineer Agent (EA) for experiment implementation and execution, and an Evolution Manager Agent (EMA) that distills insights from prior interactions into reusable knowledge. EvoScientist contains two persistent memory modules: (i) an ideation memory, which summarizes feasible research directions from top-ranked ideas while recording previously unsuccessful directions; and (ii) an experimentation memory, which captures effective data processing and model training strategies derived from code search trajectories and best-performing implementations. These modules enable the RA and EA to retrieve relevant prior strategies, improving idea quality and code execution success rates over time. Experiments show that EvoScientist outperforms 7 open-source and commercial state-of-the-art systems in scientific idea generation, achieving higher novelty, feasibility, relevance, and clarity via automatic and human evaluation. EvoScientist also substantially improves code execution success rates through multi-agent evolution, demonstrating persistent memory's effectiveness for end-to-end scientific discovery.