Virtuose Maschinen: Auf dem Weg zur Künstlichen Allgemeinen Wissenschaft
Virtuous Machines: Towards Artificial General Science
August 19, 2025
papers.authors: Gabrielle Wehr, Reuben Rideaux, Amaya J. Fox, David R. Lightfoot, Jason Tangen, Jason B. Mattingley, Shane E. Ehrhardt
cs.AI
papers.abstract
Künstliche Intelligenzsysteme revolutionieren die wissenschaftliche Entdeckung, indem sie spezifische Forschungsaufgaben beschleunigen, von der Vorhersage von Proteinstrukturen bis hin zum Materialdesign, bleiben jedoch auf enge Domänen beschränkt, die erhebliche menschliche Aufsicht erfordern. Das exponentielle Wachstum der wissenschaftlichen Literatur und die zunehmende Domänenspezialisierung schränken die Fähigkeit von Forschern ein, Wissen über Disziplinen hinweg zu synthetisieren und vereinheitlichende Theorien zu entwickeln, was die Erforschung allgemeinerer KI-Systeme für die Wissenschaft motiviert. Hier zeigen wir, dass ein domänenunabhängiges, agentenbasiertes KI-System den wissenschaftlichen Arbeitsablauf eigenständig navigieren kann – von der Hypothesengenerierung über die Datenerhebung bis zur Manuskripterstellung. Das System entwarf und führte autonom drei psychologische Studien zu visuellem Arbeitsgedächtnis, mentaler Rotation und Bildhaftigkeit durch, führte eine neue Online-Datenerhebung mit 288 Teilnehmern durch, entwickelte Analysepipelines in mehr als 8-stündigen kontinuierlichen Codierungssitzungen und erstellte fertige Manuskripte. Die Ergebnisse demonstrieren die Fähigkeit von KI-gestützten wissenschaftlichen Entdeckungspipelines, nicht-triviale Forschung mit theoretischem Denken und methodischer Strenge durchzuführen, die mit der von erfahrenen Forschern vergleichbar ist, jedoch mit Einschränkungen in konzeptioneller Nuance und theoretischer Interpretation. Dies ist ein Schritt hin zu verkörperter KI, die Hypothesen durch reale Experimente testen kann, indem sie autonom Regionen des wissenschaftlichen Raums erkundet, die aufgrund menschlicher kognitiver und ressourcenbedingter Einschränkungen sonst unerforscht bleiben könnten. Es wirft wichtige Fragen über die Natur des wissenschaftlichen Verständnisses und die Zuschreibung wissenschaftlicher Anerkennung auf.
English
Artificial intelligence systems are transforming scientific discovery by
accelerating specific research tasks, from protein structure prediction to
materials design, yet remain confined to narrow domains requiring substantial
human oversight. The exponential growth of scientific literature and increasing
domain specialisation constrain researchers' capacity to synthesise knowledge
across disciplines and develop unifying theories, motivating exploration of
more general-purpose AI systems for science. Here we show that a
domain-agnostic, agentic AI system can independently navigate the scientific
workflow - from hypothesis generation through data collection to manuscript
preparation. The system autonomously designed and executed three psychological
studies on visual working memory, mental rotation, and imagery vividness,
executed one new online data collection with 288 participants, developed
analysis pipelines through 8-hour+ continuous coding sessions, and produced
completed manuscripts. The results demonstrate the capability of AI scientific
discovery pipelines to conduct non-trivial research with theoretical reasoning
and methodological rigour comparable to experienced researchers, though with
limitations in conceptual nuance and theoretical interpretation. This is a step
toward embodied AI that can test hypotheses through real-world experiments,
accelerating discovery by autonomously exploring regions of scientific space
that human cognitive and resource constraints might otherwise leave unexplored.
It raises important questions about the nature of scientific understanding and
the attribution of scientific credit.