DeepScientist: Het Bevorderen van Grensverleggende Wetenschappelijke Ontdekkingen Progressief
DeepScientist: Advancing Frontier-Pushing Scientific Findings Progressively
September 30, 2025
Auteurs: Yixuan Weng, Minjun Zhu, Qiujie Xie, Qiyao Sun, Zhen Lin, Sifan Liu, Yue Zhang
cs.AI
Samenvatting
Hoewel eerdere AI Scientist-systemen nieuwe bevindingen kunnen genereren, missen ze vaak de focus om wetenschappelijk waardevolle bijdragen te leveren die dringende, door mensen gedefinieerde uitdagingen aanpakken. Wij introduceren DeepScientist, een systeem dat is ontworpen om dit te overwinnen door doelgerichte, volledig autonome wetenschappelijke ontdekkingen uit te voeren over tijdlijnen van maanden. Het formaliseert ontdekking als een Bayesiaanse optimalisatieprobleem, geoperationaliseerd via een hiërarchisch evaluatieproces bestaande uit "hypotheseren, verifiëren en analyseren". Door gebruik te maken van een cumulatieve Bevindingen Geheugen, balanceert deze lus intelligent de exploratie van nieuwe hypothesen met exploitatie, waarbij de meest veelbelovende bevindingen selectief worden bevorderd naar hogere validatieniveaus. Na meer dan 20.000 GPU-uren te hebben verbruikt, genereerde het systeem ongeveer 5.000 unieke wetenschappelijke ideeën en valideerde experimenteel ongeveer 1100 daarvan, waardoor het uiteindelijk door mensen ontworpen state-of-the-art (SOTA) methoden overtrof op drie frontier AI-taken met respectievelijk 183,7%, 1,9% en 7,9%. Dit werk levert het eerste grootschalige bewijs van een AI die ontdekkingen bereikt die geleidelijk de menselijke SOTA overtreffen op wetenschappelijke taken, en waardevolle bevindingen produceert die de grens van wetenschappelijke ontdekking echt verleggen. Om verder onderzoek naar dit proces te vergemakkelijken, zullen we alle experimentele logs en systeemcode openbaar maken op https://github.com/ResearAI/DeepScientist/.
English
While previous AI Scientist systems can generate novel findings, they often
lack the focus to produce scientifically valuable contributions that address
pressing human-defined challenges. We introduce DeepScientist, a system
designed to overcome this by conducting goal-oriented, fully autonomous
scientific discovery over month-long timelines. It formalizes discovery as a
Bayesian Optimization problem, operationalized through a hierarchical
evaluation process consisting of "hypothesize, verify, and analyze". Leveraging
a cumulative Findings Memory, this loop intelligently balances the exploration
of novel hypotheses with exploitation, selectively promoting the most promising
findings to higher-fidelity levels of validation. Consuming over 20,000 GPU
hours, the system generated about 5,000 unique scientific ideas and
experimentally validated approximately 1100 of them, ultimately surpassing
human-designed state-of-the-art (SOTA) methods on three frontier AI tasks by
183.7\%, 1.9\%, and 7.9\%. This work provides the first large-scale evidence of
an AI achieving discoveries that progressively surpass human SOTA on scientific
tasks, producing valuable findings that genuinely push the frontier of
scientific discovery. To facilitate further research into this process, we will
open-source all experimental logs and system code at
https://github.com/ResearAI/DeepScientist/.