EvoMaster: Un Marco de Agentes Fundamental para Construir Agentes Científicos Autónomos en Evolución a Escala
EvoMaster: A Foundational Agent Framework for Building Evolving Autonomous Scientific Agents at Scale
April 19, 2026
Autores: Xinyu Zhu, Yuzhu Cai, Zexi Liu, Cheng Wang, Fengyang Li, Wenkai Jin, Wanxu Liu, Zehao Bing, Bingyang Zheng, Jingyi Chai, Shuo Tang, Rui Ye, Yuwen Du, Xianghe Pang, Yaxin Du, Tingjia Miao, Yuzhi Zhang, Ruoxue Liao, Zhaohan Ding, Linfeng Zhang, Yanfeng Wang, Weinan E, Siheng Chen
cs.AI
Resumen
La convergencia entre los grandes modelos de lenguaje y los agentes está catalizando una nueva era del descubrimiento científico: la Ciencia Agéntica. Aunque el método científico es inherentemente iterativo, los marcos de agentes existentes son predominantemente estáticos, de alcance limitado y carecen de capacidad para aprender mediante prueba y error. Para cerrar esta brecha, presentamos EvoMaster, un marco fundamental de agentes en evolución diseñado específicamente para la Ciencia Agéntica a Gran Escala. Impulsado por el principio central de la autoevolución continua, EvoMaster permite a los agentes refinar hipótesis de forma iterativa, autoevaluarse y acumular conocimiento progresivamente a lo largo de ciclos experimentales, reflejando fielmente la indagación científica humana. De manera crucial, como plataforma base independiente del dominio, EvoMaster es excepcionalmente fácil de escalar, permitiendo a los desarrolladores construir e implementar agentes científicos altamente capacitados y autoevolutivos para disciplinas arbitrarias en aproximadamente 100 líneas de código. Sobre la base de EvoMaster, incubamos el ecosistema SciMaster en diversos campos como el aprendizaje automático, la física y las ciencias generales. Las evaluaciones en cuatro benchmarks autorizados (Humanity's Last Exam, MLE-Bench Lite, BrowseComp y FrontierScience) demuestran que EvoMaster alcanza puntuaciones state-of-the-art del 41.1%, 75.8%, 73.3% y 53.3%, respectivamente. Supera integralmente al baseline de propósito general OpenClaw con mejoras relativas que van desde +159% hasta +316%, validando robustamente su eficacia y generalidad como el principal marco fundamental para la próxima generación de descubrimiento científico autónomo. EvoMaster está disponible en https://github.com/sjtu-sai-agents/EvoMaster.
English
The convergence of large language models and agents is catalyzing a new era of scientific discovery: Agentic Science. While the scientific method is inherently iterative, existing agent frameworks are predominantly static, narrowly scoped, and lack the capacity to learn from trial and error. To bridge this gap, we present EvoMaster, a foundational evolving agent framework engineered specifically for Agentic Science at Scale. Driven by the core principle of continuous self-evolution, EvoMaster empowers agents to iteratively refine hypotheses, self-critique, and progressively accumulate knowledge across experimental cycles, faithfully mirroring human scientific inquiry. Crucially, as a domain-agnostic base harness, EvoMaster is exceptionally easy to scale up -- enabling developers to build and deploy highly capable, self-evolving scientific agents for arbitrary disciplines in approximately 100 lines of code. Built upon EvoMaster, we incubated the SciMaster ecosystem across domains such as machine learning, physics, and general science. Evaluations on four authoritative benchmarks (Humanity's Last Exam, MLE-Bench Lite, BrowseComp, and FrontierScience) demonstrate that EvoMaster achieves state-of-the-art scores of 41.1%, 75.8%, 73.3%, and 53.3%, respectively. It comprehensively outperforms the general-purpose baseline OpenClaw with relative improvements ranging from +159% to +316%, robustly validating its efficacy and generality as the premier foundational framework for the next generation of autonomous scientific discovery. EvoMaster is available at https://github.com/sjtu-sai-agents/EvoMaster.