EvoMaster: Ein grundlegendes Agenten-Framework zur skalierbaren Entwicklung sich entwickelnder autonomer wissenschaftlicher Agenten

Zusammenfassung

Die Konvergenz von Large Language Models und Agenten katalysiert ein neues Zeitalter der wissenschaftlichen Entdeckung: Agentic Science. Während die wissenschaftliche Methode inhärent iterativ ist, sind bestehende Agenten-Frameworks überwiegend statisch, eng fokussiert und nicht in der Lage, aus Versuch und Irrtum zu lernen. Um diese Lücke zu schließen, stellen wir EvoMaster vor, ein fundamentales, sich entwickelndes Agenten-Framework, das speziell für Agentic Science at Scale entwickelt wurde. Angetrieben vom Kernprinzip der kontinuierlichen Selbstevolution befähigt EvoMaster Agenten dazu, Hypothesen iterativ zu verfeinern, Selbstkritik zu üben und Wissen über experimentelle Zyklen hinweg progressiv anzusammeln – und spiegelt so getreu die menschliche wissenschaftliche Forschung wider. Entscheidend ist, dass EvoMaster als domänenunabhängige Basisplattform außerordentlich einfach skaliert werden kann. Entwickler können damit hochleistungsfähige, sich selbst weiterentwickelnde wissenschaftliche Agenten für beliebige Disziplinen in etwa 100 Codezeilen erstellen und einsetzen. Aufbauend auf EvoMaster haben wir das SciMaster-Ökosystem in Bereichen wie maschinellem Lernen, Physik und allgemeiner Wissenschaft etabliert. Evaluationen auf vier autoritativen Benchmarks (Humanity's Last Exam, MLE-Bench Lite, BrowseComp und FrontierScience) zeigen, dass EvoMaster state-of-the-art Ergebnisse von 41,1 %, 75,8 %, 73,3 % bzw. 53,3 % erzielt. Es übertrifft den generalistischen Baseline-Ansatz OpenClaw durchgängig mit relativen Verbesserungen von +159 % bis +316 % und validiert robust seine Wirksamkeit und Allgemeingültigkeit als das führende fundamentale Framework für die nächste Generation autonomer wissenschaftlicher Entdeckung. EvoMaster ist verfügbar unter https://github.com/sjtu-sai-agents/EvoMaster.

English

The convergence of large language models and agents is catalyzing a new era of scientific discovery: Agentic Science. While the scientific method is inherently iterative, existing agent frameworks are predominantly static, narrowly scoped, and lack the capacity to learn from trial and error. To bridge this gap, we present EvoMaster, a foundational evolving agent framework engineered specifically for Agentic Science at Scale. Driven by the core principle of continuous self-evolution, EvoMaster empowers agents to iteratively refine hypotheses, self-critique, and progressively accumulate knowledge across experimental cycles, faithfully mirroring human scientific inquiry. Crucially, as a domain-agnostic base harness, EvoMaster is exceptionally easy to scale up -- enabling developers to build and deploy highly capable, self-evolving scientific agents for arbitrary disciplines in approximately 100 lines of code. Built upon EvoMaster, we incubated the SciMaster ecosystem across domains such as machine learning, physics, and general science. Evaluations on four authoritative benchmarks (Humanity's Last Exam, MLE-Bench Lite, BrowseComp, and FrontierScience) demonstrate that EvoMaster achieves state-of-the-art scores of 41.1%, 75.8%, 73.3%, and 53.3%, respectively. It comprehensively outperforms the general-purpose baseline OpenClaw with relative improvements ranging from +159% to +316%, robustly validating its efficacy and generality as the premier foundational framework for the next generation of autonomous scientific discovery. EvoMaster is available at https://github.com/sjtu-sai-agents/EvoMaster.

EvoMaster: Ein grundlegendes Agenten-Framework zur skalierbaren Entwicklung sich entwickelnder autonomer wissenschaftlicher Agenten

EvoMaster: A Foundational Agent Framework for Building Evolving Autonomous Scientific Agents at Scale

Zusammenfassung

Support