EvoMaster: Un Framework Agente Fondazionale per la Costruzione su Vastissima Scala di Agenti Scientifici Autonomi in Evoluzione

Abstract

La convergenza tra grandi modelli linguistici e agenti sta catalizzando una nuova era della scoperta scientifica: la Scienza Agente. Sebbene il metodo scientifico sia intrinsecamente iterativo, gli attuali framework per agenti sono prevalentemente statici, con ambiti ristretti e privi della capacità di apprendere per tentativi ed errori. Per colmare questa lacuna, presentiamo EvoMaster, un framework fondazionale per agenti evolutivi progettato specificamente per la Scienza Agente su larga scala. Guidato dal principio cardine dell'auto-evoluzione continua, EvoMaster consente agli agenti di affinare iterativamente le ipotesi, autocriticarsi e accumulare progressivamente conoscenza attraverso i cicli sperimentali, rispecchiando fedelmente l'indagine scientifica umana. Fondamentalmente, in quanto base domain-agnostic, EvoMaster è eccezionalmente semplice da scalare, permettendo agli sviluppatori di costruire e distribuire agenti scientifici altamente capaci e auto-evolutivi per discipline arbitrarie in circa 100 righe di codice. Sulla base di EvoMaster, abbiamo incubato l'ecosistema SciMaster in domini come l'apprendimento automatico, la fisica e le scienze generali. Le valutazioni su quattro benchmark autorevoli (Humanity's Last Exam, MLE-Bench Lite, BrowseComp e FrontierScience) dimostrano che EvoMaster raggiunge punteggi state-of-the-art rispettivamente del 41,1%, 75,8%, 73,3% e 53,3. Supera in modo completo il baseline generico OpenClaw con miglioramenti relativi che vanno dal +159% al +316%, convalidando solidamente la sua efficacia e generalità come principale framework fondazionale per la prossima generazione di scoperte scientifiche autonome. EvoMaster è disponibile all'indirizzo https://github.com/sjtu-sai-agents/EvoMaster.

English

The convergence of large language models and agents is catalyzing a new era of scientific discovery: Agentic Science. While the scientific method is inherently iterative, existing agent frameworks are predominantly static, narrowly scoped, and lack the capacity to learn from trial and error. To bridge this gap, we present EvoMaster, a foundational evolving agent framework engineered specifically for Agentic Science at Scale. Driven by the core principle of continuous self-evolution, EvoMaster empowers agents to iteratively refine hypotheses, self-critique, and progressively accumulate knowledge across experimental cycles, faithfully mirroring human scientific inquiry. Crucially, as a domain-agnostic base harness, EvoMaster is exceptionally easy to scale up -- enabling developers to build and deploy highly capable, self-evolving scientific agents for arbitrary disciplines in approximately 100 lines of code. Built upon EvoMaster, we incubated the SciMaster ecosystem across domains such as machine learning, physics, and general science. Evaluations on four authoritative benchmarks (Humanity's Last Exam, MLE-Bench Lite, BrowseComp, and FrontierScience) demonstrate that EvoMaster achieves state-of-the-art scores of 41.1%, 75.8%, 73.3%, and 53.3%, respectively. It comprehensively outperforms the general-purpose baseline OpenClaw with relative improvements ranging from +159% to +316%, robustly validating its efficacy and generality as the premier foundational framework for the next generation of autonomous scientific discovery. EvoMaster is available at https://github.com/sjtu-sai-agents/EvoMaster.

EvoMaster: Un Framework Agente Fondazionale per la Costruzione su Vastissima Scala di Agenti Scientifici Autonomi in Evoluzione

EvoMaster: A Foundational Agent Framework for Building Evolving Autonomous Scientific Agents at Scale

Abstract

Support