Darwin Gödel Machine: Open-Einde Evolutie van Zelfverbeterende Agents
Darwin Godel Machine: Open-Ended Evolution of Self-Improving Agents
May 29, 2025
Auteurs: Jenny Zhang, Shengran Hu, Cong Lu, Robert Lange, Jeff Clune
cs.AI
Samenvatting
De huidige AI-systemen hebben door mensen ontworpen, vaste architecturen en kunnen zich niet autonoom en continu verbeteren. De vooruitgang van AI zou zelf geautomatiseerd kunnen worden. Als dit veilig gebeurt, zou het de ontwikkeling van AI versnellen en ons in staat stellen om de voordelen ervan veel sneller te benutten. Meta-leren kan de ontdekking van nieuwe algoritmen automatiseren, maar wordt beperkt door eerstegraadsverbeteringen en het menselijke ontwerp van een geschikte zoekruimte. De G\"odel-machine stelde een theoretisch alternatief voor: een zelfverbeterende AI die zichzelf herhaaldelijk op een bewezen gunstige manier wijzigt. Helaas is het in de praktijk onmogelijk om te bewijzen dat de meeste wijzigingen netto gunstig zijn. Wij introduceren de Darwin G\"odel Machine (DGM), een zelfverbeterend systeem dat iteratief zijn eigen code wijzigt (en daarmee ook zijn vermogen om zijn eigen codebase te wijzigen verbetert) en elke wijziging empirisch valideert met behulp van coderingsbenchmarks. Geïnspireerd door Darwiniaanse evolutie en onderzoek naar open-eindigheid, onderhoudt de DGM een archief van gegenereerde coderingsagenten. Het breidt het archief uit door een agent eruit te selecteren en een foundation model te gebruiken om een nieuwe, interessante versie van de geselecteerde agent te creëren. Deze open-eindige verkenning vormt een groeiende boom van diverse, hoogwaardige agenten en maakt de parallelle verkenning van vele verschillende paden door de zoekruimte mogelijk. Empirisch verbetert de DGM automatisch zijn coderingscapaciteiten (bijvoorbeeld betere codebewerkingstools, beheer van lange-contextvensters, peer-reviewmechanismen), waardoor de prestaties op SWE-bench stijgen van 20,0% naar 50,0%, en op Polyglot van 14,2% naar 30,7%. Bovendien presteert de DGM aanzienlijk beter dan baselines zonder zelfverbetering of open-eindige verkenning. Alle experimenten werden uitgevoerd met veiligheidsmaatregelen (bijvoorbeeld sandboxing, menselijk toezicht). De DGM is een belangrijke stap in de richting van zelfverbeterende AI, die in staat is om zijn eigen stapstenen te verzamelen langs paden die uitmonden in eindeloze innovatie.
English
Today's AI systems have human-designed, fixed architectures and cannot
autonomously and continuously improve themselves. The advance of AI could
itself be automated. If done safely, that would accelerate AI development and
allow us to reap its benefits much sooner. Meta-learning can automate the
discovery of novel algorithms, but is limited by first-order improvements and
the human design of a suitable search space. The G\"odel machine proposed a
theoretical alternative: a self-improving AI that repeatedly modifies itself in
a provably beneficial manner. Unfortunately, proving that most changes are net
beneficial is impossible in practice. We introduce the Darwin G\"odel Machine
(DGM), a self-improving system that iteratively modifies its own code (thereby
also improving its ability to modify its own codebase) and empirically
validates each change using coding benchmarks. Inspired by Darwinian evolution
and open-endedness research, the DGM maintains an archive of generated coding
agents. It grows the archive by sampling an agent from it and using a
foundation model to create a new, interesting, version of the sampled agent.
This open-ended exploration forms a growing tree of diverse, high-quality
agents and allows the parallel exploration of many different paths through the
search space. Empirically, the DGM automatically improves its coding
capabilities (e.g., better code editing tools, long-context window management,
peer-review mechanisms), increasing performance on SWE-bench from 20.0% to
50.0%, and on Polyglot from 14.2% to 30.7%. Furthermore, the DGM significantly
outperforms baselines without self-improvement or open-ended exploration. All
experiments were done with safety precautions (e.g., sandboxing, human
oversight). The DGM is a significant step toward self-improving AI, capable of
gathering its own stepping stones along paths that unfold into endless
innovation.