ChatPaper.aiChatPaper

EvoMaster: Un Framework Agente Fondazionale per la Costruzione su Vastissima Scala di Agenti Scientifici Autonomi in Evoluzione

EvoMaster: A Foundational Agent Framework for Building Evolving Autonomous Scientific Agents at Scale

April 19, 2026
Autori: Xinyu Zhu, Yuzhu Cai, Zexi Liu, Cheng Wang, Fengyang Li, Wenkai Jin, Wanxu Liu, Zehao Bing, Bingyang Zheng, Jingyi Chai, Shuo Tang, Rui Ye, Yuwen Du, Xianghe Pang, Yaxin Du, Tingjia Miao, Yuzhi Zhang, Ruoxue Liao, Zhaohan Ding, Linfeng Zhang, Yanfeng Wang, Weinan E, Siheng Chen
cs.AI

Abstract

La convergenza tra grandi modelli linguistici e agenti sta catalizzando una nuova era della scoperta scientifica: la Scienza Agente. Sebbene il metodo scientifico sia intrinsecamente iterativo, gli attuali framework per agenti sono prevalentemente statici, con ambiti ristretti e privi della capacità di apprendere per tentativi ed errori. Per colmare questa lacuna, presentiamo EvoMaster, un framework fondazionale per agenti evolutivi progettato specificamente per la Scienza Agente su larga scala. Guidato dal principio cardine dell'auto-evoluzione continua, EvoMaster consente agli agenti di affinare iterativamente le ipotesi, autocriticarsi e accumulare progressivamente conoscenza attraverso i cicli sperimentali, rispecchiando fedelmente l'indagine scientifica umana. Fondamentalmente, in quanto base domain-agnostic, EvoMaster è eccezionalmente semplice da scalare, permettendo agli sviluppatori di costruire e distribuire agenti scientifici altamente capaci e auto-evolutivi per discipline arbitrarie in circa 100 righe di codice. Sulla base di EvoMaster, abbiamo incubato l'ecosistema SciMaster in domini come l'apprendimento automatico, la fisica e le scienze generali. Le valutazioni su quattro benchmark autorevoli (Humanity's Last Exam, MLE-Bench Lite, BrowseComp e FrontierScience) dimostrano che EvoMaster raggiunge punteggi state-of-the-art rispettivamente del 41,1%, 75,8%, 73,3% e 53,3. Supera in modo completo il baseline generico OpenClaw con miglioramenti relativi che vanno dal +159% al +316%, convalidando solidamente la sua efficacia e generalità come principale framework fondazionale per la prossima generazione di scoperte scientifiche autonome. EvoMaster è disponibile all'indirizzo https://github.com/sjtu-sai-agents/EvoMaster.
English
The convergence of large language models and agents is catalyzing a new era of scientific discovery: Agentic Science. While the scientific method is inherently iterative, existing agent frameworks are predominantly static, narrowly scoped, and lack the capacity to learn from trial and error. To bridge this gap, we present EvoMaster, a foundational evolving agent framework engineered specifically for Agentic Science at Scale. Driven by the core principle of continuous self-evolution, EvoMaster empowers agents to iteratively refine hypotheses, self-critique, and progressively accumulate knowledge across experimental cycles, faithfully mirroring human scientific inquiry. Crucially, as a domain-agnostic base harness, EvoMaster is exceptionally easy to scale up -- enabling developers to build and deploy highly capable, self-evolving scientific agents for arbitrary disciplines in approximately 100 lines of code. Built upon EvoMaster, we incubated the SciMaster ecosystem across domains such as machine learning, physics, and general science. Evaluations on four authoritative benchmarks (Humanity's Last Exam, MLE-Bench Lite, BrowseComp, and FrontierScience) demonstrate that EvoMaster achieves state-of-the-art scores of 41.1%, 75.8%, 73.3%, and 53.3%, respectively. It comprehensively outperforms the general-purpose baseline OpenClaw with relative improvements ranging from +159% to +316%, robustly validating its efficacy and generality as the premier foundational framework for the next generation of autonomous scientific discovery. EvoMaster is available at https://github.com/sjtu-sai-agents/EvoMaster.
PDF11April 22, 2026