DeepScientist : Faire progresser les découvertes scientifiques de pointe de manière progressive

papers.abstract

Bien que les systèmes précédents de type AI Scientist puissent générer des découvertes novatrices, ils manquent souvent de concentration pour produire des contributions scientifiquement précieuses qui répondent à des défis urgents définis par l'humanité. Nous présentons DeepScientist, un système conçu pour surmonter cet obstacle en menant des découvertes scientifiques entièrement autonomes et orientées vers un objectif sur des périodes de plusieurs mois. Il formalise la découverte comme un problème d'Optimisation Bayésienne, opérationnalisé à travers un processus d'évaluation hiérarchique composé des étapes "hypothétiser, vérifier et analyser". En s'appuyant sur une Mémoire des Découvertes cumulative, cette boucle équilibre intelligemment l'exploration de nouvelles hypothèses avec l'exploitation, en promouvant sélectivement les découvertes les plus prometteuses vers des niveaux de validation de plus haute fidélité. Consommant plus de 20 000 heures GPU, le système a généré environ 5 000 idées scientifiques uniques et en a validé expérimentalement environ 1 100, surpassant finalement les méthodes de pointe (SOTA) conçues par l'homme sur trois tâches d'IA de pointe par 183,7 %, 1,9 % et 7,9 %. Ce travail fournit la première preuve à grande échelle qu'une IA peut réaliser des découvertes qui surpassent progressivement le SOTA humain sur des tâches scientifiques, produisant des résultats précieux qui repoussent véritablement les frontières de la découverte scientifique. Pour faciliter des recherches ultérieures sur ce processus, nous rendrons publics tous les journaux d'expérimentation et le code du système à l'adresse https://github.com/ResearAI/DeepScientist/.

English

While previous AI Scientist systems can generate novel findings, they often lack the focus to produce scientifically valuable contributions that address pressing human-defined challenges. We introduce DeepScientist, a system designed to overcome this by conducting goal-oriented, fully autonomous scientific discovery over month-long timelines. It formalizes discovery as a Bayesian Optimization problem, operationalized through a hierarchical evaluation process consisting of "hypothesize, verify, and analyze". Leveraging a cumulative Findings Memory, this loop intelligently balances the exploration of novel hypotheses with exploitation, selectively promoting the most promising findings to higher-fidelity levels of validation. Consuming over 20,000 GPU hours, the system generated about 5,000 unique scientific ideas and experimentally validated approximately 1100 of them, ultimately surpassing human-designed state-of-the-art (SOTA) methods on three frontier AI tasks by 183.7\%, 1.9\%, and 7.9\%. This work provides the first large-scale evidence of an AI achieving discoveries that progressively surpass human SOTA on scientific tasks, producing valuable findings that genuinely push the frontier of scientific discovery. To facilitate further research into this process, we will open-source all experimental logs and system code at https://github.com/ResearAI/DeepScientist/.

DeepScientist : Faire progresser les découvertes scientifiques de pointe de manière progressive

DeepScientist: Advancing Frontier-Pushing Scientific Findings Progressively

papers.abstract

Support