ChatPaper.aiChatPaper

DeepScientist: Продвижение передовых научных открытий Постепенно

DeepScientist: Advancing Frontier-Pushing Scientific Findings Progressively

September 30, 2025
Авторы: Yixuan Weng, Minjun Zhu, Qiujie Xie, Qiyao Sun, Zhen Lin, Sifan Liu, Yue Zhang
cs.AI

Аннотация

Хотя предыдущие системы AI Scientist способны генерировать новые открытия, они часто не обладают достаточной направленностью для создания научно значимых результатов, которые решают актуальные задачи, определенные человеком. Мы представляем DeepScientist — систему, разработанную для преодоления этого ограничения путем проведения целенаправленных, полностью автономных научных открытий на временных интервалах продолжительностью в несколько месяцев. Она формализует процесс открытия как задачу байесовской оптимизации, реализуемую через иерархический процесс оценки, состоящий из этапов "гипотеза, проверка и анализ". Используя накопительную память Findings Memory, этот цикл интеллектуально балансирует исследование новых гипотез с их использованием, избирательно продвигая наиболее перспективные результаты на более высокие уровни проверки. Потратив более 20 000 GPU-часов, система сгенерировала около 5 000 уникальных научных идей и экспериментально подтвердила примерно 1 100 из них, в конечном итоге превзойдя человеческие методы, соответствующие современному уровню (state-of-the-art, SOTA), на трех передовых задачах ИИ на 183,7%, 1,9% и 7,9%. Эта работа представляет собой первое крупномасштабное доказательство того, что ИИ способен достигать открытий, которые постепенно превосходят человеческий SOTA в научных задачах, создавая ценные результаты, которые действительно продвигают границы научного познания. Чтобы способствовать дальнейшим исследованиям в этой области, мы опубликуем все экспериментальные журналы и код системы на https://github.com/ResearAI/DeepScientist/.
English
While previous AI Scientist systems can generate novel findings, they often lack the focus to produce scientifically valuable contributions that address pressing human-defined challenges. We introduce DeepScientist, a system designed to overcome this by conducting goal-oriented, fully autonomous scientific discovery over month-long timelines. It formalizes discovery as a Bayesian Optimization problem, operationalized through a hierarchical evaluation process consisting of "hypothesize, verify, and analyze". Leveraging a cumulative Findings Memory, this loop intelligently balances the exploration of novel hypotheses with exploitation, selectively promoting the most promising findings to higher-fidelity levels of validation. Consuming over 20,000 GPU hours, the system generated about 5,000 unique scientific ideas and experimentally validated approximately 1100 of them, ultimately surpassing human-designed state-of-the-art (SOTA) methods on three frontier AI tasks by 183.7\%, 1.9\%, and 7.9\%. This work provides the first large-scale evidence of an AI achieving discoveries that progressively surpass human SOTA on scientific tasks, producing valuable findings that genuinely push the frontier of scientific discovery. To facilitate further research into this process, we will open-source all experimental logs and system code at https://github.com/ResearAI/DeepScientist/.
PDF123October 1, 2025