OmniScientist: Hacia un Ecosistema de Coevolución de Científicos Humanos y de IA
OmniScientist: Toward a Co-evolving Ecosystem of Human and AI Scientists
November 21, 2025
Autores: Chenyang Shao, Dehao Huang, Yu Li, Keyu Zhao, Weiquan Lin, Yining Zhang, Qingbin Zeng, Zhiyu Chen, Tianxing Li, Yifei Huang, Taozhong Wu, Xinyang Liu, Ruotong Zhao, Mengsheng Zhao, Xuhua Zhang, Yue Wang, Yuanyi Zhen, Fengli Xu, Yong Li, Tie-Yan Liu
cs.AI
Resumen
Con el rápido desarrollo de los Modelos de Lenguaje a Gran Escala (LLM), los agentes de IA han demostrado una competencia creciente en tareas científicas, que abarcan desde la generación de hipótesis y el diseño experimental hasta la redacción de manuscritos. Dichos sistemas de agentes se denominan comúnmente "Científicos de IA". Sin embargo, los Científicos de IA existentes formulan predominantemente el descubrimiento científico como un problema de búsqueda u optimización aislado, pasando por alto el hecho de que la investigación científica es inherentemente una empresa social y colaborativa. La ciencia del mundo real se basa en una infraestructura científica compleja compuesta por mecanismos de colaboración, atribución de contribuciones, revisión por pares y redes estructuradas de conocimiento científico. Debido a la falta de modelado de estas dimensiones críticas, los sistemas actuales luchan por establecer un ecosistema de investigación genuino o interactuar profundamente con la comunidad científica humana. Para cerrar esta brecha, presentamos OmniScientist, un marco que codifica explícitamente los mecanismos subyacentes de la investigación humana en el flujo de trabajo científico de la IA. OmniScientist no solo logra la automatización integral en los cimientos de datos, revisión bibliográfica, ideación de la investigación, automatización de experimentos, redacción científica y revisión por pares, sino que también proporciona un soporte infraestructural integral mediante la simulación del sistema científico humano, que comprende: (1) un sistema de conocimiento estructurado basado en redes de citas y correlaciones conceptuales; (2) un protocolo de investigación colaborativa (OSP), que permite una colaboración multiagente fluida y la participación de investigadores humanos; y (3) una plataforma de evaluación abierta (ScienceArena) basada en votaciones ciegas por pares de usuarios y rankings Elo. Esta infraestructura permite a los agentes no solo comprender y aprovechar los sistemas de conocimiento humano, sino también colaborar y coevolucionar, fomentando un ecosistema de innovación sostenible y escalable.
English
With the rapid development of Large Language Models (LLMs), AI agents have demonstrated increasing proficiency in scientific tasks, ranging from hypothesis generation and experimental design to manuscript writing. Such agent systems are commonly referred to as "AI Scientists." However, existing AI Scientists predominantly formulate scientific discovery as a standalone search or optimization problem, overlooking the fact that scientific research is inherently a social and collaborative endeavor. Real-world science relies on a complex scientific infrastructure composed of collaborative mechanisms, contribution attribution, peer review, and structured scientific knowledge networks. Due to the lack of modeling for these critical dimensions, current systems struggle to establish a genuine research ecosystem or interact deeply with the human scientific community. To bridge this gap, we introduce OmniScientist, a framework that explicitly encodes the underlying mechanisms of human research into the AI scientific workflow. OmniScientist not only achieves end-to-end automation across data foundation, literature review, research ideation, experiment automation, scientific writing, and peer review, but also provides comprehensive infrastructural support by simulating the human scientific system, comprising: (1) a structured knowledge system built upon citation networks and conceptual correlations; (2) a collaborative research protocol (OSP), which enables seamless multi-agent collaboration and human researcher participation; and (3) an open evaluation platform (ScienceArena) based on blind pairwise user voting and Elo rankings. This infrastructure empowers agents to not only comprehend and leverage human knowledge systems but also to collaborate and co-evolve, fostering a sustainable and scalable innovation ecosystem.