Máquina de Gödel de Darwin: Evolução Aberta de Agentes de Automelhoramento
Darwin Godel Machine: Open-Ended Evolution of Self-Improving Agents
May 29, 2025
Autores: Jenny Zhang, Shengran Hu, Cong Lu, Robert Lange, Jeff Clune
cs.AI
Resumo
Os sistemas de IA atuais possuem arquiteturas fixas projetadas por humanos e não podem se aprimorar de forma autônoma e contínua. O avanço da IA poderia ser automatizado. Se feito com segurança, isso aceleraria o desenvolvimento da IA e nos permitiria colher seus benefícios muito mais cedo. A meta-aprendizagem pode automatizar a descoberta de novos algoritmos, mas é limitada por melhorias de primeira ordem e pelo design humano de um espaço de busca adequado. A Máquina de Gödel propôs uma alternativa teórica: uma IA autoaprimorante que se modifica repetidamente de maneira comprovadamente benéfica. Infelizmente, provar que a maioria das mudanças é benéfica líquida é impossível na prática. Introduzimos a Máquina de Gödel Darwiniana (DGM), um sistema autoaprimorante que modifica iterativamente seu próprio código (melhorando assim também sua capacidade de modificar sua base de código) e valida empiricamente cada mudança usando benchmarks de codificação. Inspirada pela evolução darwiniana e pela pesquisa de abertura infinita, a DGM mantém um arquivo de agentes de codificação gerados. Ela expande o arquivo ao amostrar um agente dele e usar um modelo de base para criar uma nova versão interessante do agente amostrado. Essa exploração de abertura infinita forma uma árvore crescente de agentes diversos e de alta qualidade e permite a exploração paralela de muitos caminhos diferentes através do espaço de busca. Empiricamente, a DGM aprimora automaticamente suas capacidades de codificação (por exemplo, melhores ferramentas de edição de código, gerenciamento de janelas de contexto longo, mecanismos de revisão por pares), aumentando o desempenho no SWE-bench de 20,0% para 50,0%, e no Polyglot de 14,2% para 30,7%. Além disso, a DGM supera significativamente as linhas de base sem autoaprimoramento ou exploração de abertura infinita. Todos os experimentos foram realizados com precauções de segurança (por exemplo, sandboxing, supervisão humana). A DGM é um passo significativo em direção à IA autoaprimorante, capaz de reunir seus próprios degraus ao longo de caminhos que se desdobram em inovação infinita.
English
Today's AI systems have human-designed, fixed architectures and cannot
autonomously and continuously improve themselves. The advance of AI could
itself be automated. If done safely, that would accelerate AI development and
allow us to reap its benefits much sooner. Meta-learning can automate the
discovery of novel algorithms, but is limited by first-order improvements and
the human design of a suitable search space. The G\"odel machine proposed a
theoretical alternative: a self-improving AI that repeatedly modifies itself in
a provably beneficial manner. Unfortunately, proving that most changes are net
beneficial is impossible in practice. We introduce the Darwin G\"odel Machine
(DGM), a self-improving system that iteratively modifies its own code (thereby
also improving its ability to modify its own codebase) and empirically
validates each change using coding benchmarks. Inspired by Darwinian evolution
and open-endedness research, the DGM maintains an archive of generated coding
agents. It grows the archive by sampling an agent from it and using a
foundation model to create a new, interesting, version of the sampled agent.
This open-ended exploration forms a growing tree of diverse, high-quality
agents and allows the parallel exploration of many different paths through the
search space. Empirically, the DGM automatically improves its coding
capabilities (e.g., better code editing tools, long-context window management,
peer-review mechanisms), increasing performance on SWE-bench from 20.0% to
50.0%, and on Polyglot from 14.2% to 30.7%. Furthermore, the DGM significantly
outperforms baselines without self-improvement or open-ended exploration. All
experiments were done with safety precautions (e.g., sandboxing, human
oversight). The DGM is a significant step toward self-improving AI, capable of
gathering its own stepping stones along paths that unfold into endless
innovation.