ChatPaper.aiChatPaper

EvoScientist: Op weg naar multi-agent evoluerende AI-wetenschappers voor end-to-end wetenschappelijke ontdekking

EvoScientist: Towards Multi-Agent Evolving AI Scientists for End-to-End Scientific Discovery

March 9, 2026
Auteurs: Yougang Lyu, Xi Zhang, Xinhao Yi, Yuyue Zhao, Shuyu Guo, Wenxiang Hu, Jan Piotrowski, Jakub Kaliski, Jacopo Urbani, Zaiqiao Meng, Lun Zhou, Xiaohui Yan
cs.AI

Samenvatting

De toenemende adoptie van Large Language Models (LLM's) stelt AI-wetenschappers in staat om complexe end-to-end wetenschappelijke ontdekkingstaken uit te voeren die coördinatie van gespecialiseerde rollen vereisen, waaronder ideeëngeneratie en experimentele uitvoering. De meeste state-of-the-art AI-wetenschapperssystemen vertrouwen echter op statische, handmatig ontworpen pijplijnen en slagen er niet in om zich aan te passen op basis van opgebouwde interactiegeschiedenissen. Hierdoor zien deze systemen veelbelovende onderzoeksrichtingen over het hoofd, herhalen ze mislukte experimenten en zetten ze in op onhaalbare ideeën. Om dit aan te pakken, introduceren we EvoScientist, een evoluerend multi-agent AI-wetenschappersraamwerk dat onderzoeksstrategieën continu verbetert door middel van persistent geheugen en zelf-evolutie. EvoScientist bestaat uit drie gespecialiseerde agents: een Onderzoeksagent (RA) voor het genereren van wetenschappelijke ideeën, een Ingenieursagent (EA) voor experimentimplementatie en -uitvoering, en een Evolutiebeheeragent (EMA) die inzichten uit eerdere interacties destilleert tot herbruikbare kennis. EvoScientist bevat twee persistente geheugenmodules: (i) een ideeëngeneratiegeheugen, dat haalbare onderzoeksrichtingen samenvat uit hoogst gerangschikte ideeën en tegelijkertijd eerder onsuccesvolle richtingen vastlegt; en (ii) een experimentatiegeheugen, dat effectieve strategieën voor gegevensverwerking en modeltraining vastlegt, afgeleid van codesporentrajecten en best presterende implementaties. Deze modules stellen de RA en EA in staat om relevante eerdere strategieën op te halen, waardoor de ideeënkwaliteit en het slagingspercentage van code-uitvoering in de loop van de tijd verbeteren. Experimenten tonen aan dat EvoScientist 7 open-source en commerciële state-of-the-art systemen overtreft in wetenschappelijke ideeëngeneratie, waarbij het hogere scores behaalt voor nieuwigheid, haalbaarheid, relevantie en helderheid via automatische en menselijke evaluatie. EvoScientist verbetert ook aanzienlijk de slagingspercentages van code-uitvoering door multi-agent evolutie, wat de effectiviteit van persistent geheugen voor end-to-end wetenschappelijke ontdekking aantoont.
English
The increasing adoption of Large Language Models (LLMs) has enabled AI scientists to perform complex end-to-end scientific discovery tasks requiring coordination of specialized roles, including idea generation and experimental execution. However, most state-of-the-art AI scientist systems rely on static, hand-designed pipelines and fail to adapt based on accumulated interaction histories. As a result, these systems overlook promising research directions, repeat failed experiments, and pursue infeasible ideas. To address this, we introduce EvoScientist, an evolving multi-agent AI scientist framework that continuously improves research strategies through persistent memory and self-evolution. EvoScientist comprises three specialized agents: a Researcher Agent (RA) for scientific idea generation, an Engineer Agent (EA) for experiment implementation and execution, and an Evolution Manager Agent (EMA) that distills insights from prior interactions into reusable knowledge. EvoScientist contains two persistent memory modules: (i) an ideation memory, which summarizes feasible research directions from top-ranked ideas while recording previously unsuccessful directions; and (ii) an experimentation memory, which captures effective data processing and model training strategies derived from code search trajectories and best-performing implementations. These modules enable the RA and EA to retrieve relevant prior strategies, improving idea quality and code execution success rates over time. Experiments show that EvoScientist outperforms 7 open-source and commercial state-of-the-art systems in scientific idea generation, achieving higher novelty, feasibility, relevance, and clarity via automatic and human evaluation. EvoScientist also substantially improves code execution success rates through multi-agent evolution, demonstrating persistent memory's effectiveness for end-to-end scientific discovery.
PDF155March 25, 2026