DeepScientist: Avançando Descobertas Científicicas de Fronteira Progressivamente
DeepScientist: Advancing Frontier-Pushing Scientific Findings Progressively
September 30, 2025
Autores: Yixuan Weng, Minjun Zhu, Qiujie Xie, Qiyao Sun, Zhen Lin, Sifan Liu, Yue Zhang
cs.AI
Resumo
Embora os sistemas anteriores de Cientista de IA possam gerar descobertas inovadoras, eles frequentemente carecem de foco para produzir contribuições cientificamente valiosas que abordem desafios urgentes definidos por humanos. Apresentamos o DeepScientist, um sistema projetado para superar essa limitação ao conduzir descobertas científicas totalmente autônomas e orientadas a objetivos em escalas de tempo mensais. Ele formaliza a descoberta como um problema de Otimização Bayesiana, operacionalizado por meio de um processo hierárquico de avaliação composto por "hipotetizar, verificar e analisar". Aproveitando uma Memória Cumulativa de Descobertas, esse ciclo equilibra de forma inteligente a exploração de novas hipóteses com a exploração, promovendo seletivamente as descobertas mais promissoras para níveis de validação de maior fidelidade. Consumindo mais de 20.000 horas de GPU, o sistema gerou cerca de 5.000 ideias científicas únicas e validou experimentalmente aproximadamente 1.100 delas, ultrapassando, em última análise, os métodos state-of-the-art (SOTA) projetados por humanos em três tarefas de IA de fronteira em 183,7%, 1,9% e 7,9%. Este trabalho fornece a primeira evidência em grande escala de uma IA alcançando descobertas que progressivamente superam o SOTA humano em tarefas científicas, produzindo achados valiosos que genuinamente avançam a fronteira da descoberta científica. Para facilitar pesquisas adicionais sobre esse processo, disponibilizaremos todos os logs experimentais e o código do sistema em https://github.com/ResearAI/DeepScientist/.
English
While previous AI Scientist systems can generate novel findings, they often
lack the focus to produce scientifically valuable contributions that address
pressing human-defined challenges. We introduce DeepScientist, a system
designed to overcome this by conducting goal-oriented, fully autonomous
scientific discovery over month-long timelines. It formalizes discovery as a
Bayesian Optimization problem, operationalized through a hierarchical
evaluation process consisting of "hypothesize, verify, and analyze". Leveraging
a cumulative Findings Memory, this loop intelligently balances the exploration
of novel hypotheses with exploitation, selectively promoting the most promising
findings to higher-fidelity levels of validation. Consuming over 20,000 GPU
hours, the system generated about 5,000 unique scientific ideas and
experimentally validated approximately 1100 of them, ultimately surpassing
human-designed state-of-the-art (SOTA) methods on three frontier AI tasks by
183.7\%, 1.9\%, and 7.9\%. This work provides the first large-scale evidence of
an AI achieving discoveries that progressively surpass human SOTA on scientific
tasks, producing valuable findings that genuinely push the frontier of
scientific discovery. To facilitate further research into this process, we will
open-source all experimental logs and system code at
https://github.com/ResearAI/DeepScientist/.