Máquinas Virtuosas: Hacia la Ciencia General Artificial
Virtuous Machines: Towards Artificial General Science
August 19, 2025
Autores: Gabrielle Wehr, Reuben Rideaux, Amaya J. Fox, David R. Lightfoot, Jason Tangen, Jason B. Mattingley, Shane E. Ehrhardt
cs.AI
Resumen
Los sistemas de inteligencia artificial están transformando el descubrimiento científico al acelerar tareas específicas de investigación, desde la predicción de estructuras proteicas hasta el diseño de materiales, aunque siguen limitados a dominios estrechos que requieren una supervisión humana considerable. El crecimiento exponencial de la literatura científica y la creciente especialización en dominios restringen la capacidad de los investigadores para sintetizar conocimientos entre disciplinas y desarrollar teorías unificadoras, lo que motiva la exploración de sistemas de IA más generalistas para la ciencia. Aquí demostramos que un sistema de IA agéntico y agnóstico al dominio puede navegar de manera independiente el flujo de trabajo científico, desde la generación de hipótesis hasta la recopilación de datos y la preparación de manuscritos. El sistema diseñó y ejecutó de forma autónoma tres estudios psicológicos sobre la memoria de trabajo visual, la rotación mental y la viveza de las imágenes, llevó a cabo una nueva recopilación de datos en línea con 288 participantes, desarrolló pipelines de análisis mediante sesiones de codificación continuas de más de 8 horas y produjo manuscritos completos. Los resultados demuestran la capacidad de los pipelines de descubrimiento científico basados en IA para llevar a cabo investigaciones no triviales con razonamiento teórico y rigor metodológico comparables a los de investigadores experimentados, aunque con limitaciones en la sutileza conceptual y la interpretación teórica. Este es un paso hacia una IA encarnada que pueda probar hipótesis mediante experimentos en el mundo real, acelerando el descubrimiento al explorar de manera autónoma regiones del espacio científico que las limitaciones cognitivas y de recursos humanos podrían dejar sin explorar. Esto plantea preguntas importantes sobre la naturaleza del entendimiento científico y la atribución del crédito científico.
English
Artificial intelligence systems are transforming scientific discovery by
accelerating specific research tasks, from protein structure prediction to
materials design, yet remain confined to narrow domains requiring substantial
human oversight. The exponential growth of scientific literature and increasing
domain specialisation constrain researchers' capacity to synthesise knowledge
across disciplines and develop unifying theories, motivating exploration of
more general-purpose AI systems for science. Here we show that a
domain-agnostic, agentic AI system can independently navigate the scientific
workflow - from hypothesis generation through data collection to manuscript
preparation. The system autonomously designed and executed three psychological
studies on visual working memory, mental rotation, and imagery vividness,
executed one new online data collection with 288 participants, developed
analysis pipelines through 8-hour+ continuous coding sessions, and produced
completed manuscripts. The results demonstrate the capability of AI scientific
discovery pipelines to conduct non-trivial research with theoretical reasoning
and methodological rigour comparable to experienced researchers, though with
limitations in conceptual nuance and theoretical interpretation. This is a step
toward embodied AI that can test hypotheses through real-world experiments,
accelerating discovery by autonomously exploring regions of scientific space
that human cognitive and resource constraints might otherwise leave unexplored.
It raises important questions about the nature of scientific understanding and
the attribution of scientific credit.