DeepScientist: Het Bevorderen van Grensverleggende Wetenschappelijke Ontdekkingen Progressief

Samenvatting

Hoewel eerdere AI Scientist-systemen nieuwe bevindingen kunnen genereren, missen ze vaak de focus om wetenschappelijk waardevolle bijdragen te leveren die dringende, door mensen gedefinieerde uitdagingen aanpakken. Wij introduceren DeepScientist, een systeem dat is ontworpen om dit te overwinnen door doelgerichte, volledig autonome wetenschappelijke ontdekkingen uit te voeren over tijdlijnen van maanden. Het formaliseert ontdekking als een Bayesiaanse optimalisatieprobleem, geoperationaliseerd via een hiërarchisch evaluatieproces bestaande uit "hypotheseren, verifiëren en analyseren". Door gebruik te maken van een cumulatieve Bevindingen Geheugen, balanceert deze lus intelligent de exploratie van nieuwe hypothesen met exploitatie, waarbij de meest veelbelovende bevindingen selectief worden bevorderd naar hogere validatieniveaus. Na meer dan 20.000 GPU-uren te hebben verbruikt, genereerde het systeem ongeveer 5.000 unieke wetenschappelijke ideeën en valideerde experimenteel ongeveer 1100 daarvan, waardoor het uiteindelijk door mensen ontworpen state-of-the-art (SOTA) methoden overtrof op drie frontier AI-taken met respectievelijk 183,7%, 1,9% en 7,9%. Dit werk levert het eerste grootschalige bewijs van een AI die ontdekkingen bereikt die geleidelijk de menselijke SOTA overtreffen op wetenschappelijke taken, en waardevolle bevindingen produceert die de grens van wetenschappelijke ontdekking echt verleggen. Om verder onderzoek naar dit proces te vergemakkelijken, zullen we alle experimentele logs en systeemcode openbaar maken op https://github.com/ResearAI/DeepScientist/.

English

While previous AI Scientist systems can generate novel findings, they often lack the focus to produce scientifically valuable contributions that address pressing human-defined challenges. We introduce DeepScientist, a system designed to overcome this by conducting goal-oriented, fully autonomous scientific discovery over month-long timelines. It formalizes discovery as a Bayesian Optimization problem, operationalized through a hierarchical evaluation process consisting of "hypothesize, verify, and analyze". Leveraging a cumulative Findings Memory, this loop intelligently balances the exploration of novel hypotheses with exploitation, selectively promoting the most promising findings to higher-fidelity levels of validation. Consuming over 20,000 GPU hours, the system generated about 5,000 unique scientific ideas and experimentally validated approximately 1100 of them, ultimately surpassing human-designed state-of-the-art (SOTA) methods on three frontier AI tasks by 183.7\%, 1.9\%, and 7.9\%. This work provides the first large-scale evidence of an AI achieving discoveries that progressively surpass human SOTA on scientific tasks, producing valuable findings that genuinely push the frontier of scientific discovery. To facilitate further research into this process, we will open-source all experimental logs and system code at https://github.com/ResearAI/DeepScientist/.

DeepScientist: Het Bevorderen van Grensverleggende Wetenschappelijke Ontdekkingen Progressief

DeepScientist: Advancing Frontier-Pushing Scientific Findings Progressively

Samenvatting

Support