Машина Дарвина-Гёделя: Бесконечная эволюция самоулучшающихся агентов
Darwin Godel Machine: Open-Ended Evolution of Self-Improving Agents
May 29, 2025
Авторы: Jenny Zhang, Shengran Hu, Cong Lu, Robert Lange, Jeff Clune
cs.AI
Аннотация
Современные системы искусственного интеллекта (ИИ) имеют фиксированные архитектуры, разработанные человеком, и не способны к автономному и непрерывному самосовершенствованию. Однако прогресс в области ИИ может быть автоматизирован. При безопасной реализации это ускорит развитие ИИ и позволит нам быстрее воспользоваться его преимуществами. Метаобучение может автоматизировать открытие новых алгоритмов, но ограничено улучшениями первого порядка и человеческим проектированием подходящего пространства поиска. Машина Гёделя предложила теоретическую альтернативу: самоулучшающийся ИИ, который многократно модифицирует себя доказательно полезным образом. К сожалению, доказательство того, что большинство изменений приносят чистую пользу, на практике невозможно. Мы представляем Машину Дарвина-Гёделя (DGM), самоулучшающуюся систему, которая итеративно модифицирует собственный код (тем самым улучшая и свою способность изменять код) и эмпирически проверяет каждое изменение с использованием тестовых заданий по программированию. Вдохновлённая дарвиновской эволюцией и исследованиями открытости, DGM поддерживает архив созданных программных агентов. Она расширяет архив, выбирая агента из него и используя базовую модель для создания новой, интересной версии выбранного агента. Это открытое исследование формирует растущее дерево разнообразных, высококачественных агентов и позволяет параллельно исследовать множество различных путей в пространстве поиска. Эмпирически DGM автоматически улучшает свои способности в программировании (например, инструменты редактирования кода, управление длинными контекстными окнами, механизмы рецензирования), повышая производительность на SWE-bench с 20,0% до 50,0% и на Polyglot с 14,2% до 30,7%. Кроме того, DGM значительно превосходит базовые подходы без самоулучшения или открытого исследования. Все эксперименты проводились с соблюдением мер безопасности (например, изоляция, контроль со стороны человека). DGM представляет собой важный шаг к самоулучшающемуся ИИ, способному собирать свои собственные ступени на пути к бесконечным инновациям.
English
Today's AI systems have human-designed, fixed architectures and cannot
autonomously and continuously improve themselves. The advance of AI could
itself be automated. If done safely, that would accelerate AI development and
allow us to reap its benefits much sooner. Meta-learning can automate the
discovery of novel algorithms, but is limited by first-order improvements and
the human design of a suitable search space. The G\"odel machine proposed a
theoretical alternative: a self-improving AI that repeatedly modifies itself in
a provably beneficial manner. Unfortunately, proving that most changes are net
beneficial is impossible in practice. We introduce the Darwin G\"odel Machine
(DGM), a self-improving system that iteratively modifies its own code (thereby
also improving its ability to modify its own codebase) and empirically
validates each change using coding benchmarks. Inspired by Darwinian evolution
and open-endedness research, the DGM maintains an archive of generated coding
agents. It grows the archive by sampling an agent from it and using a
foundation model to create a new, interesting, version of the sampled agent.
This open-ended exploration forms a growing tree of diverse, high-quality
agents and allows the parallel exploration of many different paths through the
search space. Empirically, the DGM automatically improves its coding
capabilities (e.g., better code editing tools, long-context window management,
peer-review mechanisms), increasing performance on SWE-bench from 20.0% to
50.0%, and on Polyglot from 14.2% to 30.7%. Furthermore, the DGM significantly
outperforms baselines without self-improvement or open-ended exploration. All
experiments were done with safety precautions (e.g., sandboxing, human
oversight). The DGM is a significant step toward self-improving AI, capable of
gathering its own stepping stones along paths that unfold into endless
innovation.