ChatPaper.aiChatPaper

SciDER: Investigador Integral Centrado en Datos Científicos

SciDER: Scientific Data-centric End-to-end Researcher

March 2, 2026
Autores: Ke Lin, Yilin Lu, Shreyas Bhat, Xuehang Guo, Junier Oliva, Qingyun Wang
cs.AI

Resumen

El descubrimiento científico automatizado con modelos de lenguaje grandes está transformando el ciclo de vida de la investigación desde la ideación hasta la experimentación, aunque los agentes existentes tienen dificultades para procesar autónomamente datos brutos recopilados de experimentos científicos. Presentamos SciDER, un sistema integral centrado en datos que automatiza el ciclo de investigación. A diferencia de los marcos tradicionales, nuestros agentes especializados analizan y procesan colaborativamente datos científicos brutos, generan hipótesis y diseños experimentales basados en características específicas de los datos, y redactan y ejecutan el código correspondiente. La evaluación en tres benchmarks demuestra que SciDER sobresale en el descubrimiento científico especializado basado en datos y supera a agentes de propósito general y modelos de última generación mediante su memoria de auto-evolución y su bucle de retroalimentación dirigido por críticos. Distribuido como un paquete modular de Python, también proporcionamos paquetes PyPI fáciles de usar con una interfaz web ligera para acelerar la investigación autónoma basada en datos, con el objetivo de ser accesible para todos los investigadores y desarrolladores.
English
Automated scientific discovery with large language models is transforming the research lifecycle from ideation to experimentation, yet existing agents struggle to autonomously process raw data collected from scientific experiments. We introduce SciDER, a data-centric end-to-end system that automates the research lifecycle. Unlike traditional frameworks, our specialized agents collaboratively parse and analyze raw scientific data, generate hypotheses and experimental designs grounded in specific data characteristics, and write and execute corresponding code. Evaluation on three benchmarks shows SciDER excels in specialized data-driven scientific discovery and outperforms general-purpose agents and state-of-the-art models through its self-evolving memory and critic-led feedback loop. Distributed as a modular Python package, we also provide easy-to-use PyPI packages with a lightweight web interface to accelerate autonomous, data-driven research and aim to be accessible to all researchers and developers.
PDF62May 8, 2026