AutoResearch AI: Rumo à Automação de Pesquisa Impulsionada por IA para Descoberta Científica
AutoResearch AI: Towards AI-Powered Research Automation for Scientific Discovery
May 22, 2026
Autores: Guiyao Tie, Jiawen Shi, Dingjie Song, Yixiao Huang, Ziji Sheng, Xueyang Zhou, Daizong Liu, Pan Zhou, Yongchao Chen, Ran Xu, Lifang He, Qingsong Wen, Manling Li, Cong Lu, Shuai Li, Pengtao Xie, Yixuan Yuan, Rui Meng, Lei Xing, Lichao Sun, Caiming Xiong, Philip S. Yu, Jianfeng Gao
cs.AI
Resumo
A pesquisa científica está sendo remodelada por sistemas de IA que transcendem o suporte isolado, direcionando-se a fluxos de trabalho de horizonte mais longo, abrangendo fundamentação bibliográfica, geração de hipóteses, experimentação, validação, relato e revisão. Essa mudança marca uma transição da IA de nível de tarefa para a automação de pesquisa em nível de fluxo de trabalho. No entanto, os sistemas atuais permanecem fragmentados, diferindo em autonomia, escopo de domínio, ambiente de execução, mecanismo de validação e supervisão humana, ao mesmo tempo em que ainda enfrentam dificuldades com preservação de evidências, reprodutibilidade, rejeição de direções fracas, rastreamento de proveniência, robustez entre domínios e encerramento científico responsável. Esta pesquisa examina esses desenvolvimentos por meio da AutoResearch, definida como o espectro evolutivo da automação de fluxos de trabalho científicos impulsionada por IA. Dentro dela, Vibe Research denota a região orientada por humanos, de assistência baseada em prompts e execução verificada por humanos, enquanto sistemas emergentes liderados por IA coordenam porções maiores do ciclo de descoberta sem alcançar autonomia robusta. Analisamos como os sistemas de pesquisa redistribuem controle, evidências, execução, validação e responsabilidade ao longo dos fluxos de trabalho, organizando o campo em torno de cinco condições de fluxo de trabalho: fundamentação bibliográfica e de pesquisa; formulação e planejamento de hipóteses; experimentação e uso de ferramentas; feedback, validação e revisão; e relato e comunicação do conhecimento. Ademais, sintetizamos sistemas de cientistas de IA, estruturas de co-pesquisa de iniciativa mista, benchmarks, implantações em domínios e infraestruturas de código aberto. Por fim, propomos cinco dimensões de avaliação — novidade, validade, impacto, confiabilidade e proveniência — e mostramos que a autonomia da AutoResearch é condicionada ao domínio, sendo mais credível em ambientes estruturados, executáveis e rapidamente verificáveis, porém limitada em contextos incorporados, atrasados, heterogêneos, éticos ou institucionalmente responsáveis.
English
Scientific research is being reshaped by AI systems that move beyond isolated assistance toward longer-horizon workflows spanning literature grounding, hypothesis generation, experimentation, validation, reporting, and revision. This shift marks a transition from task-level AI for science to workflow-level research automation. Yet current systems remain fragmented, differing in autonomy, domain scope, execution environment, validation mechanism, and human oversight, while still struggling with evidence preservation, reproducibility, weak-direction rejection, provenance tracking, cross-domain robustness, and accountable scientific closure. This survey examines these developments through AutoResearch, defined as the developmental spectrum of AI-powered scientific workflow automation. Within it, Vibe Research denotes the human-steered region of prompt-based assistance and human-verified execution, whereas emerging AI-led systems coordinate larger portions of the discovery loop without achieving robust autonomy. We analyze how research systems redistribute control, evidence, execution, validation, and accountability across workflows and organize the field around five workflow conditions: literature and research grounding; hypothesis formation and planning; experimentation and tool use; feedback, validation, and review; and reporting and knowledge communication. We further synthesize AI scientist systems, mixed-initiative co-research frameworks, benchmarks, domain deployments, and open-source infrastructures. Finally, we propose five evaluation dimensions--novelty, validity, impact, reliability, and provenance--and show that AutoResearch autonomy is domain-conditioned, being more credible in structured, executable, and rapidly verifiable settings but limited in embodied, delayed, heterogeneous, ethical, or institutionally accountable contexts.