Открытие научных алгоритмов путем расширения AlphaEvolve с использованием глубоких исследований

Аннотация

Крупные языковые модели (LLM) демонстрируют потенциал в качестве научных ассистентов, однако существующие подходы либо полагаются исключительно на эволюцию алгоритмов, либо на углублённые исследования в изоляции, что в обоих случаях сталкивается с серьёзными ограничениями. Чистая эволюция алгоритмов, как в AlphaEvolve, опирается только на внутренние знания LLM и быстро достигает плато в сложных областях, тогда как чистое углублённое исследование предлагает идеи без их проверки, что приводит к нереалистичным или нереализуемым решениям. Мы представляем DeepEvolve — агент, который интегрирует углублённое исследование с эволюцией алгоритмов, объединяя извлечение внешних знаний, редактирование кода между файлами и систематическую отладку в рамках итерационного цикла, управляемого обратной связью. Каждая итерация не только предлагает новые гипотезы, но также уточняет, реализует и тестирует их, избегая как поверхностных улучшений, так и непродуктивного излишнего усложнения. На девяти тестовых наборах в областях химии, математики, биологии, материаловедения и патентов DeepEvolve последовательно улучшает начальный алгоритм, создавая исполняемые новые алгоритмы с устойчивым прогрессом. Устраняя разрыв между неконтролируемой эволюцией и исследованиями без заземления, DeepEvolve предоставляет надёжную основу для продвижения в области открытия научных алгоритмов. Наш код доступен по адресу https://github.com/liugangcode/deepevolve.

English

Large language models hold promise as scientific assistants, yet existing agents either rely solely on algorithm evolution or on deep research in isolation, both of which face critical limitations. Pure algorithm evolution, as in AlphaEvolve, depends only on the internal knowledge of LLMs and quickly plateaus in complex domains, while pure deep research proposes ideas without validation, resulting in unrealistic or unimplementable solutions. We present DeepEvolve, an agent that integrates deep research with algorithm evolution, uniting external knowledge retrieval, cross-file code editing, and systematic debugging under a feedback-driven iterative loop. Each iteration not only proposes new hypotheses but also refines, implements, and tests them, avoiding both shallow improvements and unproductive over-refinements. Across nine benchmarks in chemistry, mathematics, biology, materials, and patents, DeepEvolve consistently improves the initial algorithm, producing executable new algorithms with sustained gains. By bridging the gap between unguided evolution and research without grounding, DeepEvolve provides a reliable framework for advancing scientific algorithm discovery. Our code is available at https://github.com/liugangcode/deepevolve.

Открытие научных алгоритмов путем расширения AlphaEvolve с использованием глубоких исследований

Scientific Algorithm Discovery by Augmenting AlphaEvolve with Deep Research

Аннотация

Support