Darwin-Gödel-Maschine: Offene Evolution selbstverbessernder Agenten
Darwin Godel Machine: Open-Ended Evolution of Self-Improving Agents
May 29, 2025
Autoren: Jenny Zhang, Shengran Hu, Cong Lu, Robert Lange, Jeff Clune
cs.AI
Zusammenfassung
Die heutigen KI-Systeme haben vom Menschen entworfene, feste Architekturen und können sich nicht autonom und kontinuierlich selbst verbessern. Der Fortschritt der KI könnte selbst automatisiert werden. Wenn dies sicher geschieht, würde dies die KI-Entwicklung beschleunigen und es uns ermöglichen, ihre Vorteile viel früher zu nutzen. Meta-Lernen kann die Entdeckung neuer Algorithmen automatisieren, ist jedoch durch Verbesserungen erster Ordnung und die menschliche Gestaltung eines geeigneten Suchraums begrenzt. Die Gödel-Maschine schlug eine theoretische Alternative vor: eine sich selbst verbessernde KI, die sich wiederholt auf nachweislich vorteilhafte Weise modifiziert. Leider ist es in der Praxis unmöglich, zu beweisen, dass die meisten Änderungen insgesamt vorteilhaft sind. Wir stellen die Darwin-Gödel-Maschine (DGM) vor, ein sich selbst verbesserndes System, das iterativ seinen eigenen Code modifiziert (und damit auch seine Fähigkeit zur Modifikation seiner eigenen Codebasis verbessert) und jede Änderung empirisch mithilfe von Codierungs-Benchmarks validiert. Inspiriert von der darwinistischen Evolution und der Forschung zur Offenheit, verwaltet die DGM ein Archiv generierter Codierungs-Agenten. Sie erweitert das Archiv, indem sie einen Agenten daraus auswählt und ein Grundlagenmodell verwendet, um eine neue, interessante Version des ausgewählten Agenten zu erstellen. Diese offene Exploration bildet einen wachsenden Baum vielfältiger, hochwertiger Agenten und ermöglicht die parallele Erkundung vieler verschiedener Pfade durch den Suchraum. Empirisch verbessert die DGM automatisch ihre Codierungsfähigkeiten (z.B. bessere Code-Bearbeitungswerkzeuge, Langzeit-Kontextverwaltung, Peer-Review-Mechanismen), steigert die Leistung auf SWE-bench von 20,0 % auf 50,0 % und auf Polyglot von 14,2 % auf 30,7 %. Darüber hinaus übertrifft die DGM Baselines ohne Selbstverbesserung oder offene Exploration deutlich. Alle Experimente wurden mit Sicherheitsvorkehrungen (z.B. Sandboxing, menschliche Aufsicht) durchgeführt. Die DGM ist ein bedeutender Schritt hin zu einer sich selbst verbessernden KI, die in der Lage ist, ihre eigenen Meilensteine entlang von Pfaden zu sammeln, die sich in endlose Innovation entfalten.
English
Today's AI systems have human-designed, fixed architectures and cannot
autonomously and continuously improve themselves. The advance of AI could
itself be automated. If done safely, that would accelerate AI development and
allow us to reap its benefits much sooner. Meta-learning can automate the
discovery of novel algorithms, but is limited by first-order improvements and
the human design of a suitable search space. The G\"odel machine proposed a
theoretical alternative: a self-improving AI that repeatedly modifies itself in
a provably beneficial manner. Unfortunately, proving that most changes are net
beneficial is impossible in practice. We introduce the Darwin G\"odel Machine
(DGM), a self-improving system that iteratively modifies its own code (thereby
also improving its ability to modify its own codebase) and empirically
validates each change using coding benchmarks. Inspired by Darwinian evolution
and open-endedness research, the DGM maintains an archive of generated coding
agents. It grows the archive by sampling an agent from it and using a
foundation model to create a new, interesting, version of the sampled agent.
This open-ended exploration forms a growing tree of diverse, high-quality
agents and allows the parallel exploration of many different paths through the
search space. Empirically, the DGM automatically improves its coding
capabilities (e.g., better code editing tools, long-context window management,
peer-review mechanisms), increasing performance on SWE-bench from 20.0% to
50.0%, and on Polyglot from 14.2% to 30.7%. Furthermore, the DGM significantly
outperforms baselines without self-improvement or open-ended exploration. All
experiments were done with safety precautions (e.g., sandboxing, human
oversight). The DGM is a significant step toward self-improving AI, capable of
gathering its own stepping stones along paths that unfold into endless
innovation.