Darwin Godel Machine: Evoluzione Aperta di Agenti Auto-Miglioranti

Abstract

I sistemi di IA odierni hanno architetture fisse progettate dall'uomo e non possono migliorarsi in modo autonomo e continuo. L'avanzamento dell'IA potrebbe essere automatizzato. Se fatto in sicurezza, ciò accelererebbe lo sviluppo dell'IA e ci permetterebbe di raccoglierne i benefici molto prima. Il meta-apprendimento può automatizzare la scoperta di nuovi algoritmi, ma è limitato da miglioramenti di primo ordine e dalla progettazione umana di uno spazio di ricerca adeguato. La macchina di Gödel ha proposto un'alternativa teorica: un'IA auto-migliorante che modifica se stessa ripetutamente in modo dimostrabilmente vantaggioso. Sfortunatamente, dimostrare che la maggior parte delle modifiche sia complessivamente benefica è impossibile nella pratica. Introduciamo la Darwin Gödel Machine (DGM), un sistema auto-migliorante che modifica iterativamente il proprio codice (migliorando così anche la sua capacità di modificare la propria base di codice) e convalida empiricamente ogni cambiamento utilizzando benchmark di codifica. Ispirata dall'evoluzione darwiniana e dalla ricerca sull'apertura, la DGM mantiene un archivio di agenti di codifica generati. Cresce l'archivio campionando un agente da esso e utilizzando un modello di base per creare una nuova versione interessante dell'agente campionato. Questa esplorazione aperta forma un albero in crescita di agenti diversi e di alta qualità e permette l'esplorazione parallela di molti percorsi diversi attraverso lo spazio di ricerca. Empiricamente, la DGM migliora automaticamente le sue capacità di codifica (ad esempio, strumenti di editing del codice migliori, gestione di finestre di contesto lunghe, meccanismi di peer-review), aumentando le prestazioni su SWE-bench dal 20,0% al 50,0%, e su Polyglot dal 14,2% al 30,7%. Inoltre, la DGM supera significativamente i baseline senza auto-miglioramento o esplorazione aperta. Tutti gli esperimenti sono stati condotti con precauzioni di sicurezza (ad esempio, sandboxing, supervisione umana). La DGM rappresenta un passo significativo verso un'IA auto-migliorante, capace di raccogliere i propri mattoni lungo percorsi che si dispiegano in un'innovazione senza fine.

English

Today's AI systems have human-designed, fixed architectures and cannot autonomously and continuously improve themselves. The advance of AI could itself be automated. If done safely, that would accelerate AI development and allow us to reap its benefits much sooner. Meta-learning can automate the discovery of novel algorithms, but is limited by first-order improvements and the human design of a suitable search space. The G\"odel machine proposed a theoretical alternative: a self-improving AI that repeatedly modifies itself in a provably beneficial manner. Unfortunately, proving that most changes are net beneficial is impossible in practice. We introduce the Darwin G\"odel Machine (DGM), a self-improving system that iteratively modifies its own code (thereby also improving its ability to modify its own codebase) and empirically validates each change using coding benchmarks. Inspired by Darwinian evolution and open-endedness research, the DGM maintains an archive of generated coding agents. It grows the archive by sampling an agent from it and using a foundation model to create a new, interesting, version of the sampled agent. This open-ended exploration forms a growing tree of diverse, high-quality agents and allows the parallel exploration of many different paths through the search space. Empirically, the DGM automatically improves its coding capabilities (e.g., better code editing tools, long-context window management, peer-review mechanisms), increasing performance on SWE-bench from 20.0% to 50.0%, and on Polyglot from 14.2% to 30.7%. Furthermore, the DGM significantly outperforms baselines without self-improvement or open-ended exploration. All experiments were done with safety precautions (e.g., sandboxing, human oversight). The DGM is a significant step toward self-improving AI, capable of gathering its own stepping stones along paths that unfold into endless innovation.

Darwin Godel Machine: Evoluzione Aperta di Agenti Auto-Miglioranti

Darwin Godel Machine: Open-Ended Evolution of Self-Improving Agents

Abstract

Support