Máquina de Gödel Darwin: Evolución Abierta de Agentes de Automejora

Resumen

Los sistemas de IA actuales tienen arquitecturas fijas diseñadas por humanos y no pueden mejorarse de manera autónoma y continua. El avance de la IA podría automatizarse. Si se hace de manera segura, esto aceleraría el desarrollo de la IA y nos permitiría obtener sus beneficios mucho antes. El metaaprendizaje puede automatizar el descubrimiento de nuevos algoritmos, pero está limitado por mejoras de primer orden y el diseño humano de un espacio de búsqueda adecuado. La máquina de Gödel propuso una alternativa teórica: una IA que se mejora a sí misma modificándose repetidamente de manera demostrablemente beneficiosa. Desafortunadamente, demostrar que la mayoría de los cambios son beneficiosos netos es imposible en la práctica. Introducimos la Máquina de Gödel Darwin (DGM, por sus siglas en inglés), un sistema que se mejora a sí mismo modificando iterativamente su propio código (mejorando así también su capacidad para modificar su base de código) y valida empíricamente cada cambio utilizando puntos de referencia de codificación. Inspirada por la evolución darwiniana y la investigación de apertura sin límites, la DGM mantiene un archivo de agentes de codificación generados. Hace crecer el archivo muestreando un agente de él y utilizando un modelo base para crear una nueva versión interesante del agente muestreado. Esta exploración sin límites forma un árbol en crecimiento de agentes diversos y de alta calidad, permitiendo la exploración paralela de múltiples caminos a través del espacio de búsqueda. Empíricamente, la DGM mejora automáticamente sus capacidades de codificación (por ejemplo, mejores herramientas de edición de código, gestión de ventanas de contexto largo, mecanismos de revisión por pares), aumentando el rendimiento en SWE-bench del 20.0% al 50.0%, y en Polyglot del 14.2% al 30.7%. Además, la DGM supera significativamente a las líneas base sin automejora o exploración sin límites. Todos los experimentos se realizaron con precauciones de seguridad (por ejemplo, aislamiento, supervisión humana). La DGM es un paso significativo hacia una IA que se mejora a sí misma, capaz de recoger sus propios peldaños a lo largo de caminos que se despliegan en una innovación sin fin.

English

Today's AI systems have human-designed, fixed architectures and cannot autonomously and continuously improve themselves. The advance of AI could itself be automated. If done safely, that would accelerate AI development and allow us to reap its benefits much sooner. Meta-learning can automate the discovery of novel algorithms, but is limited by first-order improvements and the human design of a suitable search space. The G\"odel machine proposed a theoretical alternative: a self-improving AI that repeatedly modifies itself in a provably beneficial manner. Unfortunately, proving that most changes are net beneficial is impossible in practice. We introduce the Darwin G\"odel Machine (DGM), a self-improving system that iteratively modifies its own code (thereby also improving its ability to modify its own codebase) and empirically validates each change using coding benchmarks. Inspired by Darwinian evolution and open-endedness research, the DGM maintains an archive of generated coding agents. It grows the archive by sampling an agent from it and using a foundation model to create a new, interesting, version of the sampled agent. This open-ended exploration forms a growing tree of diverse, high-quality agents and allows the parallel exploration of many different paths through the search space. Empirically, the DGM automatically improves its coding capabilities (e.g., better code editing tools, long-context window management, peer-review mechanisms), increasing performance on SWE-bench from 20.0% to 50.0%, and on Polyglot from 14.2% to 30.7%. Furthermore, the DGM significantly outperforms baselines without self-improvement or open-ended exploration. All experiments were done with safety precautions (e.g., sandboxing, human oversight). The DGM is a significant step toward self-improving AI, capable of gathering its own stepping stones along paths that unfold into endless innovation.

Máquina de Gödel Darwin: Evolución Abierta de Agentes de Automejora

Darwin Godel Machine: Open-Ended Evolution of Self-Improving Agents

Resumen

Support