DeepScientist: Förderung wegweisender wissenschaftlicher Erkenntnisse Fortschrittlich
DeepScientist: Advancing Frontier-Pushing Scientific Findings Progressively
September 30, 2025
papers.authors: Yixuan Weng, Minjun Zhu, Qiujie Xie, Qiyao Sun, Zhen Lin, Sifan Liu, Yue Zhang
cs.AI
papers.abstract
Während frühere AI-Scientist-Systeme in der Lage sind, neuartige Erkenntnisse zu generieren, fehlt ihnen oft der Fokus, um wissenschaftlich wertvolle Beiträge zu leisten, die dringende, vom Menschen definierte Herausforderungen adressieren. Wir stellen DeepScientist vor, ein System, das dies überwinden soll, indem es zielgerichtete, vollständig autonome wissenschaftliche Entdeckungen über monatelange Zeiträume durchführt. Es formalisiert die Entdeckung als ein Bayesian-Optimierungs-Problem, das durch einen hierarchischen Bewertungsprozess bestehend aus „Hypothesenbildung, Verifizierung und Analyse“ operationalisiert wird. Durch die Nutzung eines kumulativen Findings Memory balanciert diese Schleife intelligent die Exploration neuer Hypothesen mit der Exploitation aus und fördert selektiv die vielversprechendsten Erkenntnisse auf höhere Validierungsstufen. Mit einem Verbrauch von über 20.000 GPU-Stunden generierte das System etwa 5.000 einzigartige wissenschaftliche Ideen und validierte experimentell ungefähr 1.100 davon, wobei es schließlich menschlich entwickelte State-of-the-Art (SOTA)-Methoden bei drei fortschrittlichen KI-Aufgaben um 183,7 %, 1,9 % und 7,9 % übertraf. Diese Arbeit liefert den ersten großflächigen Beweis dafür, dass eine KI Entdeckungen erzielt, die menschliche SOTA bei wissenschaftlichen Aufgaben schrittweise übertreffen, und wertvolle Erkenntnisse produziert, die die Grenzen der wissenschaftlichen Entdeckung tatsächlich vorantreiben. Um weitere Forschungen zu diesem Prozess zu ermöglichen, werden wir alle experimentellen Protokolle und Systemcodes unter https://github.com/ResearAI/DeepScientist/ open-sourcen.
English
While previous AI Scientist systems can generate novel findings, they often
lack the focus to produce scientifically valuable contributions that address
pressing human-defined challenges. We introduce DeepScientist, a system
designed to overcome this by conducting goal-oriented, fully autonomous
scientific discovery over month-long timelines. It formalizes discovery as a
Bayesian Optimization problem, operationalized through a hierarchical
evaluation process consisting of "hypothesize, verify, and analyze". Leveraging
a cumulative Findings Memory, this loop intelligently balances the exploration
of novel hypotheses with exploitation, selectively promoting the most promising
findings to higher-fidelity levels of validation. Consuming over 20,000 GPU
hours, the system generated about 5,000 unique scientific ideas and
experimentally validated approximately 1100 of them, ultimately surpassing
human-designed state-of-the-art (SOTA) methods on three frontier AI tasks by
183.7\%, 1.9\%, and 7.9\%. This work provides the first large-scale evidence of
an AI achieving discoveries that progressively surpass human SOTA on scientific
tasks, producing valuable findings that genuinely push the frontier of
scientific discovery. To facilitate further research into this process, we will
open-source all experimental logs and system code at
https://github.com/ResearAI/DeepScientist/.