EvoMaster: Базовый фреймворк агентов для создания эволюционирующих автономных научных агентов в промышленных масштабах
EvoMaster: A Foundational Agent Framework for Building Evolving Autonomous Scientific Agents at Scale
April 19, 2026
Авторы: Xinyu Zhu, Yuzhu Cai, Zexi Liu, Cheng Wang, Fengyang Li, Wenkai Jin, Wanxu Liu, Zehao Bing, Bingyang Zheng, Jingyi Chai, Shuo Tang, Rui Ye, Yuwen Du, Xianghe Pang, Yaxin Du, Tingjia Miao, Yuzhi Zhang, Ruoxue Liao, Zhaohan Ding, Linfeng Zhang, Yanfeng Wang, Weinan E, Siheng Chen
cs.AI
Аннотация
Сближение больших языковых моделей и агентов знаменует новую эру научных открытий: Агентно-ориентированную Науку (Agentic Science). Хотя научный метод по своей природе итеративен, существующие фреймворки для агентов остаются преимущественно статичными, узкоспециализированными и неспособными учиться на основе проб и ошибок. Чтобы устранить этот разрыв, мы представляем EvoMaster — базовый фреймворк эволюционирующих агентов, созданный специально для Масштабируемой Агентно-ориентированной Науки. Руководствуясь ключевым принципом непрерывного саморазвития, EvoMaster позволяет агентам итеративно уточнять гипотезы, проводить самокритику и постепенно накапливать знания в ходе экспериментальных циклов, достоверно отражая процесс человеческого научного поиска. Что особенно важно, будучи предметно-независимой базовой платформой, EvoMaster исключительно легко масштабируется — разработчики могут создавать и развертывать высокопроизводительных, саморазвивающихся научных агентов для произвольных дисциплин примерно в 100 строках кода. На основе EvoMaster мы создали экосистему SciMaster для таких областей, как машинное обучение, физика и наука общего профиля. Оценки на четырех авторитетных тестовых наборах (Humanity's Last Exam, MLE-Bench Lite, BrowseComp и FrontierScience) демонстрируют, что EvoMaster достигает наивысших результатов в 41.1%, 75.8%, 73.3% и 53.3% соответственно. Он всесторонне превосходит базовую универсальную модель OpenClaw с относительным улучшением показателей от +159% до +316%, что убедительно подтверждает его эффективность и универсальность в качестве передового базового фреймворка для следующего поколения автономных научных открытий. EvoMaster доступен по адресу https://github.com/sjtu-sai-agents/EvoMaster.
English
The convergence of large language models and agents is catalyzing a new era of scientific discovery: Agentic Science. While the scientific method is inherently iterative, existing agent frameworks are predominantly static, narrowly scoped, and lack the capacity to learn from trial and error. To bridge this gap, we present EvoMaster, a foundational evolving agent framework engineered specifically for Agentic Science at Scale. Driven by the core principle of continuous self-evolution, EvoMaster empowers agents to iteratively refine hypotheses, self-critique, and progressively accumulate knowledge across experimental cycles, faithfully mirroring human scientific inquiry. Crucially, as a domain-agnostic base harness, EvoMaster is exceptionally easy to scale up -- enabling developers to build and deploy highly capable, self-evolving scientific agents for arbitrary disciplines in approximately 100 lines of code. Built upon EvoMaster, we incubated the SciMaster ecosystem across domains such as machine learning, physics, and general science. Evaluations on four authoritative benchmarks (Humanity's Last Exam, MLE-Bench Lite, BrowseComp, and FrontierScience) demonstrate that EvoMaster achieves state-of-the-art scores of 41.1%, 75.8%, 73.3%, and 53.3%, respectively. It comprehensively outperforms the general-purpose baseline OpenClaw with relative improvements ranging from +159% to +316%, robustly validating its efficacy and generality as the premier foundational framework for the next generation of autonomous scientific discovery. EvoMaster is available at https://github.com/sjtu-sai-agents/EvoMaster.