EvoMaster: Een Fundamenteel Agentraamwerk voor het Bouwen van Evoluerende Autonome Wetenschappelijke Agents op Schaal
EvoMaster: A Foundational Agent Framework for Building Evolving Autonomous Scientific Agents at Scale
April 19, 2026
Auteurs: Xinyu Zhu, Yuzhu Cai, Zexi Liu, Cheng Wang, Fengyang Li, Wenkai Jin, Wanxu Liu, Zehao Bing, Bingyang Zheng, Jingyi Chai, Shuo Tang, Rui Ye, Yuwen Du, Xianghe Pang, Yaxin Du, Tingjia Miao, Yuzhi Zhang, Ruoxue Liao, Zhaohan Ding, Linfeng Zhang, Yanfeng Wang, Weinan E, Siheng Chen
cs.AI
Samenvatting
De convergentie van grote taalmodel(len) en agenten katalyseert een nieuw tijdperk van wetenschappelijke ontdekking: Agent-gebaseerde Wetenschap. Hoewel de wetenschappelijke methode inherent iteratief is, zijn bestaande agentframeworks overwegend statisch, smal van opzet en missen ze het vermogen om te leren van trial-and-error. Om deze kloof te overbruggen, presenteren we EvoMaster, een fundamenteel evoluerend agentframework dat specifiek is ontwikkeld voor Grootschalige Agent-gebaseerde Wetenschap. Gedreven door het kernprincipe van continue zelfevolutie stelt EvoMaster agenten in staat om hypothesen iteratief te verfijnen, zelfkritiek toe te passen en kennis progressief op te bouwen over experimentele cycli heen, waardoor het menselijke wetenschappelijke onderzoek nauwkeurig wordt nagebootst. Cruciaal is dat EvoMaster, als domein-agnostisch basisraamwerk, uitzonderlijk eenvoudig op te schalen is – waardoor ontwikkelaars in staat worden gesteld om zeer capabele, zelf-evoluerende wetenschappelijke agenten voor willekeurige disciplines te bouwen en implementeren in ongeveer 100 regels code. Gebaseerd op EvoMaster hebben we het SciMaster-ecosysteem geïncubeerd binnen domeinen zoals machine learning, natuurkunde en algemene wetenschap. Evaluaties op vier gezaghebbende benchmarks (Humanity's Last Exam, MLE-Bench Lite, BrowseComp en FrontierScience) tonen aan dat EvoMaster state-of-the-art scores behaalt van respectievelijk 41,1%, 75,8%, 73,3% en 53,3%. Het presteert alomvattend beter dan de algemene baseline OpenClaw met relatieve verbeteringen variërend van +159% tot +316%, wat de effectiviteit en algemeenheid robuust valideert als het toonaangevende fundamentele framework voor de volgende generatie van autonome wetenschappelijke ontdekking. EvoMaster is beschikbaar op https://github.com/sjtu-sai-agents/EvoMaster.
English
The convergence of large language models and agents is catalyzing a new era of scientific discovery: Agentic Science. While the scientific method is inherently iterative, existing agent frameworks are predominantly static, narrowly scoped, and lack the capacity to learn from trial and error. To bridge this gap, we present EvoMaster, a foundational evolving agent framework engineered specifically for Agentic Science at Scale. Driven by the core principle of continuous self-evolution, EvoMaster empowers agents to iteratively refine hypotheses, self-critique, and progressively accumulate knowledge across experimental cycles, faithfully mirroring human scientific inquiry. Crucially, as a domain-agnostic base harness, EvoMaster is exceptionally easy to scale up -- enabling developers to build and deploy highly capable, self-evolving scientific agents for arbitrary disciplines in approximately 100 lines of code. Built upon EvoMaster, we incubated the SciMaster ecosystem across domains such as machine learning, physics, and general science. Evaluations on four authoritative benchmarks (Humanity's Last Exam, MLE-Bench Lite, BrowseComp, and FrontierScience) demonstrate that EvoMaster achieves state-of-the-art scores of 41.1%, 75.8%, 73.3%, and 53.3%, respectively. It comprehensively outperforms the general-purpose baseline OpenClaw with relative improvements ranging from +159% to +316%, robustly validating its efficacy and generality as the premier foundational framework for the next generation of autonomous scientific discovery. EvoMaster is available at https://github.com/sjtu-sai-agents/EvoMaster.