ChatPaper.aiChatPaper

DeepScientist: Avanzare le Scoperte Scientifiche all'Avanguardia Progressivamente

DeepScientist: Advancing Frontier-Pushing Scientific Findings Progressively

September 30, 2025
Autori: Yixuan Weng, Minjun Zhu, Qiujie Xie, Qiyao Sun, Zhen Lin, Sifan Liu, Yue Zhang
cs.AI

Abstract

Mentre i precedenti sistemi di AI Scientist possono generare scoperte innovative, spesso mancano della focalizzazione necessaria per produrre contributi scientificamente preziosi che affrontino sfide urgenti definite dall'uomo. Introduciamo DeepScientist, un sistema progettato per superare questo limite conducendo scoperte scientifiche completamente autonome e orientate a obiettivi su scale temporali mensili. Esso formalizza la scoperta come un problema di Ottimizzazione Bayesiana, operazionalizzato attraverso un processo di valutazione gerarchico composto da "ipotesi, verifica e analisi". Sfruttando una Memoria Cumulativa delle Scoperte, questo ciclo bilancia in modo intelligente l'esplorazione di nuove ipotesi con lo sfruttamento delle conoscenze, promuovendo selettivamente i risultati più promettenti a livelli di validazione di maggiore fedeltà. Consumando oltre 20.000 ore di GPU, il sistema ha generato circa 5.000 idee scientifiche uniche e ne ha validate sperimentalmente circa 1.100, superando infine i metodi all'avanguardia (SOTA) progettati dall'uomo in tre compiti di frontiera dell'IA rispettivamente del 183,7%, 1,9% e 7,9%. Questo lavoro fornisce la prima prova su larga scala di un'IA che raggiunge scoperte che superano progressivamente lo SOTA umano in compiti scientifici, producendo risultati preziosi che spingono genuinamente la frontiera della scoperta scientifica. Per facilitare ulteriori ricerche su questo processo, renderemo open-source tutti i log sperimentali e il codice del sistema all'indirizzo https://github.com/ResearAI/DeepScientist/.
English
While previous AI Scientist systems can generate novel findings, they often lack the focus to produce scientifically valuable contributions that address pressing human-defined challenges. We introduce DeepScientist, a system designed to overcome this by conducting goal-oriented, fully autonomous scientific discovery over month-long timelines. It formalizes discovery as a Bayesian Optimization problem, operationalized through a hierarchical evaluation process consisting of "hypothesize, verify, and analyze". Leveraging a cumulative Findings Memory, this loop intelligently balances the exploration of novel hypotheses with exploitation, selectively promoting the most promising findings to higher-fidelity levels of validation. Consuming over 20,000 GPU hours, the system generated about 5,000 unique scientific ideas and experimentally validated approximately 1100 of them, ultimately surpassing human-designed state-of-the-art (SOTA) methods on three frontier AI tasks by 183.7\%, 1.9\%, and 7.9\%. This work provides the first large-scale evidence of an AI achieving discoveries that progressively surpass human SOTA on scientific tasks, producing valuable findings that genuinely push the frontier of scientific discovery. To facilitate further research into this process, we will open-source all experimental logs and system code at https://github.com/ResearAI/DeepScientist/.
PDF164October 1, 2025