Deugdzame Machines: Op Weg naar Algemene Kunstmatige Wetenschap
Virtuous Machines: Towards Artificial General Science
August 19, 2025
Auteurs: Gabrielle Wehr, Reuben Rideaux, Amaya J. Fox, David R. Lightfoot, Jason Tangen, Jason B. Mattingley, Shane E. Ehrhardt
cs.AI
Samenvatting
Kunstmatige intelligentiesystemen transformeren wetenschappelijke ontdekkingen door specifieke onderzoeks taken te versnellen, van eiwitstructuurvoorspelling tot materiaalontwerp, maar blijven beperkt tot smalle domeinen die aanzienlijk menselijk toezicht vereisen. De exponentiële groei van wetenschappelijke literatuur en toenemende domeinspecialisatie beperken het vermogen van onderzoekers om kennis over disciplines heen te synthetiseren en unificerende theorieën te ontwikkelen, wat de verkenning van meer algemene AI-systemen voor wetenschap motiveert. Hier tonen we aan dat een domein-agnostisch, agentisch AI-systeem zelfstandig de wetenschappelijke workflow kan navigeren - van hypothesegeneratie via dataverzameling tot manuscriptvoorbereiding. Het systeem ontwierp en voerde autonoom drie psychologische studies uit over visueel werkgeheugen, mentale rotatie en levendigheid van verbeelding, voerde een nieuwe online dataverzameling uit met 288 deelnemers, ontwikkelde analysepijplijnen via coderingssessies van 8 uur of langer, en produceerde voltooide manuscripten. De resultaten demonstreren de capaciteit van AI-wetenschappelijke ontdekkingspijplijnen om niet-triviaal onderzoek uit te voeren met theoretische redenering en methodologische strengheid vergelijkbaar met ervaren onderzoekers, hoewel met beperkingen in conceptuele nuance en theoretische interpretatie. Dit is een stap naar belichaamde AI die hypothesen kan testen via experimenten in de echte wereld, waardoor ontdekkingen worden versneld door autonoom regio's van de wetenschappelijke ruimte te verkennen die menselijke cognitieve en resourcebeperkingen anders onontgonnen zouden laten. Het roept belangrijke vragen op over de aard van wetenschappelijk begrip en de toekenning van wetenschappelijke erkenning.
English
Artificial intelligence systems are transforming scientific discovery by
accelerating specific research tasks, from protein structure prediction to
materials design, yet remain confined to narrow domains requiring substantial
human oversight. The exponential growth of scientific literature and increasing
domain specialisation constrain researchers' capacity to synthesise knowledge
across disciplines and develop unifying theories, motivating exploration of
more general-purpose AI systems for science. Here we show that a
domain-agnostic, agentic AI system can independently navigate the scientific
workflow - from hypothesis generation through data collection to manuscript
preparation. The system autonomously designed and executed three psychological
studies on visual working memory, mental rotation, and imagery vividness,
executed one new online data collection with 288 participants, developed
analysis pipelines through 8-hour+ continuous coding sessions, and produced
completed manuscripts. The results demonstrate the capability of AI scientific
discovery pipelines to conduct non-trivial research with theoretical reasoning
and methodological rigour comparable to experienced researchers, though with
limitations in conceptual nuance and theoretical interpretation. This is a step
toward embodied AI that can test hypotheses through real-world experiments,
accelerating discovery by autonomously exploring regions of scientific space
that human cognitive and resource constraints might otherwise leave unexplored.
It raises important questions about the nature of scientific understanding and
the attribution of scientific credit.