DeepScientist: フロンティアを推進する科学的発見の進展 段階的に
DeepScientist: Advancing Frontier-Pushing Scientific Findings Progressively
September 30, 2025
著者: Yixuan Weng, Minjun Zhu, Qiujie Xie, Qiyao Sun, Zhen Lin, Sifan Liu, Yue Zhang
cs.AI
要旨
従来のAI Scientistシステムは新規の発見を生成できるものの、人間が定義する喫緊の課題に対処する科学的に価値ある貢献を生み出すための焦点を欠いていることが多かった。本論文では、この課題を克服するため、数ヶ月にわたる目標指向型の完全自律的な科学的発見を実施するDeepScientistシステムを紹介する。本システムは発見をベイズ最適化問題として形式化し、「仮説生成、検証、分析」からなる階層的評価プロセスを通じてこれを運用する。累積的な発見メモリを活用することで、このループは新規仮説の探索と活用をインテリジェントにバランスさせ、最も有望な発見をより高精度な検証段階へと選択的に昇格させる。20,000 GPU時間以上を消費し、約5,000のユニークな科学的アイデアを生成し、そのうち約1,100を実験的に検証した結果、3つの最先端AIタスクにおいて人間が設計した最新手法をそれぞれ183.7%、1.9%、7.9%上回る成果を達成した。本研究は、AIが科学的タスクにおいて人間の最先端を段階的に超える発見を達成し、科学的発見のフロンティアを真に押し進める価値ある知見を生み出した初めての大規模な証拠を提供する。このプロセスに関するさらなる研究を促進するため、すべての実験ログとシステムコードをhttps://github.com/ResearAI/DeepScientist/でオープンソースとして公開する予定である。
English
While previous AI Scientist systems can generate novel findings, they often
lack the focus to produce scientifically valuable contributions that address
pressing human-defined challenges. We introduce DeepScientist, a system
designed to overcome this by conducting goal-oriented, fully autonomous
scientific discovery over month-long timelines. It formalizes discovery as a
Bayesian Optimization problem, operationalized through a hierarchical
evaluation process consisting of "hypothesize, verify, and analyze". Leveraging
a cumulative Findings Memory, this loop intelligently balances the exploration
of novel hypotheses with exploitation, selectively promoting the most promising
findings to higher-fidelity levels of validation. Consuming over 20,000 GPU
hours, the system generated about 5,000 unique scientific ideas and
experimentally validated approximately 1100 of them, ultimately surpassing
human-designed state-of-the-art (SOTA) methods on three frontier AI tasks by
183.7\%, 1.9\%, and 7.9\%. This work provides the first large-scale evidence of
an AI achieving discoveries that progressively surpass human SOTA on scientific
tasks, producing valuable findings that genuinely push the frontier of
scientific discovery. To facilitate further research into this process, we will
open-source all experimental logs and system code at
https://github.com/ResearAI/DeepScientist/.