DeepScientist : Faire progresser les découvertes scientifiques de pointe de manière progressive
DeepScientist: Advancing Frontier-Pushing Scientific Findings Progressively
September 30, 2025
papers.authors: Yixuan Weng, Minjun Zhu, Qiujie Xie, Qiyao Sun, Zhen Lin, Sifan Liu, Yue Zhang
cs.AI
papers.abstract
Bien que les systèmes précédents de type AI Scientist puissent générer des découvertes novatrices, ils manquent souvent de concentration pour produire des contributions scientifiquement précieuses qui répondent à des défis urgents définis par l'humanité. Nous présentons DeepScientist, un système conçu pour surmonter cet obstacle en menant des découvertes scientifiques entièrement autonomes et orientées vers un objectif sur des périodes de plusieurs mois. Il formalise la découverte comme un problème d'Optimisation Bayésienne, opérationnalisé à travers un processus d'évaluation hiérarchique composé des étapes "hypothétiser, vérifier et analyser". En s'appuyant sur une Mémoire des Découvertes cumulative, cette boucle équilibre intelligemment l'exploration de nouvelles hypothèses avec l'exploitation, en promouvant sélectivement les découvertes les plus prometteuses vers des niveaux de validation de plus haute fidélité. Consommant plus de 20 000 heures GPU, le système a généré environ 5 000 idées scientifiques uniques et en a validé expérimentalement environ 1 100, surpassant finalement les méthodes de pointe (SOTA) conçues par l'homme sur trois tâches d'IA de pointe par 183,7 %, 1,9 % et 7,9 %. Ce travail fournit la première preuve à grande échelle qu'une IA peut réaliser des découvertes qui surpassent progressivement le SOTA humain sur des tâches scientifiques, produisant des résultats précieux qui repoussent véritablement les frontières de la découverte scientifique. Pour faciliter des recherches ultérieures sur ce processus, nous rendrons publics tous les journaux d'expérimentation et le code du système à l'adresse https://github.com/ResearAI/DeepScientist/.
English
While previous AI Scientist systems can generate novel findings, they often
lack the focus to produce scientifically valuable contributions that address
pressing human-defined challenges. We introduce DeepScientist, a system
designed to overcome this by conducting goal-oriented, fully autonomous
scientific discovery over month-long timelines. It formalizes discovery as a
Bayesian Optimization problem, operationalized through a hierarchical
evaluation process consisting of "hypothesize, verify, and analyze". Leveraging
a cumulative Findings Memory, this loop intelligently balances the exploration
of novel hypotheses with exploitation, selectively promoting the most promising
findings to higher-fidelity levels of validation. Consuming over 20,000 GPU
hours, the system generated about 5,000 unique scientific ideas and
experimentally validated approximately 1100 of them, ultimately surpassing
human-designed state-of-the-art (SOTA) methods on three frontier AI tasks by
183.7\%, 1.9\%, and 7.9\%. This work provides the first large-scale evidence of
an AI achieving discoveries that progressively surpass human SOTA on scientific
tasks, producing valuable findings that genuinely push the frontier of
scientific discovery. To facilitate further research into this process, we will
open-source all experimental logs and system code at
https://github.com/ResearAI/DeepScientist/.