ChatPaper.aiChatPaper

SciDER: Pesquisador Científico de Dados de Ponta a Ponta

SciDER: Scientific Data-centric End-to-end Researcher

March 2, 2026
Autores: Ke Lin, Yilin Lu, Shreyas Bhat, Xuehang Guo, Junier Oliva, Qingyun Wang
cs.AI

Resumo

A descoberta científica automatizada com modelos de linguagem de grande escala está a transformar o ciclo de vida da investigação, desde a ideação até à experimentação, contudo, os agentes existentes lutam por processar autonomamente dados brutos recolhidos de experiências científicas. Apresentamos o SciDER, um sistema centrado nos dados e de ponta a ponta que automatiza o ciclo de vida da investigação. Ao contrário de estruturas tradicionais, os nossos agentes especializados analisam e processam colaborativamente dados científicos brutos, geram hipóteses e desenhos experimentais fundamentados em características específicas dos dados, e escrevem e executam o código correspondente. A avaliação em três benchmarks mostra que o SciDER se destaca na descoberta científica especializada e orientada por dados e supera agentes de propósito geral e modelos state-of-the-art através da sua memória auto-evolutiva e ciclo de feedback liderado por críticas. Distribuído como um pacote Python modular, disponibilizamos também pacotes PyPI de fácil utilização com uma interface web leve para acelerar a investigação autónoma e orientada por dados, com o objetivo de ser acessível a todos os investigadores e desenvolvedores.
English
Automated scientific discovery with large language models is transforming the research lifecycle from ideation to experimentation, yet existing agents struggle to autonomously process raw data collected from scientific experiments. We introduce SciDER, a data-centric end-to-end system that automates the research lifecycle. Unlike traditional frameworks, our specialized agents collaboratively parse and analyze raw scientific data, generate hypotheses and experimental designs grounded in specific data characteristics, and write and execute corresponding code. Evaluation on three benchmarks shows SciDER excels in specialized data-driven scientific discovery and outperforms general-purpose agents and state-of-the-art models through its self-evolving memory and critic-led feedback loop. Distributed as a modular Python package, we also provide easy-to-use PyPI packages with a lightweight web interface to accelerate autonomous, data-driven research and aim to be accessible to all researchers and developers.
PDF42March 7, 2026