ChatPaper.aiChatPaper

DeepScientist: Avançando Descobertas Científicicas de Fronteira Progressivamente

DeepScientist: Advancing Frontier-Pushing Scientific Findings Progressively

September 30, 2025
Autores: Yixuan Weng, Minjun Zhu, Qiujie Xie, Qiyao Sun, Zhen Lin, Sifan Liu, Yue Zhang
cs.AI

Resumo

Embora os sistemas anteriores de Cientista de IA possam gerar descobertas inovadoras, eles frequentemente carecem de foco para produzir contribuições cientificamente valiosas que abordem desafios urgentes definidos por humanos. Apresentamos o DeepScientist, um sistema projetado para superar essa limitação ao conduzir descobertas científicas totalmente autônomas e orientadas a objetivos em escalas de tempo mensais. Ele formaliza a descoberta como um problema de Otimização Bayesiana, operacionalizado por meio de um processo hierárquico de avaliação composto por "hipotetizar, verificar e analisar". Aproveitando uma Memória Cumulativa de Descobertas, esse ciclo equilibra de forma inteligente a exploração de novas hipóteses com a exploração, promovendo seletivamente as descobertas mais promissoras para níveis de validação de maior fidelidade. Consumindo mais de 20.000 horas de GPU, o sistema gerou cerca de 5.000 ideias científicas únicas e validou experimentalmente aproximadamente 1.100 delas, ultrapassando, em última análise, os métodos state-of-the-art (SOTA) projetados por humanos em três tarefas de IA de fronteira em 183,7%, 1,9% e 7,9%. Este trabalho fornece a primeira evidência em grande escala de uma IA alcançando descobertas que progressivamente superam o SOTA humano em tarefas científicas, produzindo achados valiosos que genuinamente avançam a fronteira da descoberta científica. Para facilitar pesquisas adicionais sobre esse processo, disponibilizaremos todos os logs experimentais e o código do sistema em https://github.com/ResearAI/DeepScientist/.
English
While previous AI Scientist systems can generate novel findings, they often lack the focus to produce scientifically valuable contributions that address pressing human-defined challenges. We introduce DeepScientist, a system designed to overcome this by conducting goal-oriented, fully autonomous scientific discovery over month-long timelines. It formalizes discovery as a Bayesian Optimization problem, operationalized through a hierarchical evaluation process consisting of "hypothesize, verify, and analyze". Leveraging a cumulative Findings Memory, this loop intelligently balances the exploration of novel hypotheses with exploitation, selectively promoting the most promising findings to higher-fidelity levels of validation. Consuming over 20,000 GPU hours, the system generated about 5,000 unique scientific ideas and experimentally validated approximately 1100 of them, ultimately surpassing human-designed state-of-the-art (SOTA) methods on three frontier AI tasks by 183.7\%, 1.9\%, and 7.9\%. This work provides the first large-scale evidence of an AI achieving discoveries that progressively surpass human SOTA on scientific tasks, producing valuable findings that genuinely push the frontier of scientific discovery. To facilitate further research into this process, we will open-source all experimental logs and system code at https://github.com/ResearAI/DeepScientist/.
PDF164October 1, 2025