딥 리서치를 통해 AlphaEvolve를 강화한 과학적 알고리즘 발견
Scientific Algorithm Discovery by Augmenting AlphaEvolve with Deep Research
October 7, 2025
저자: Gang Liu, Yihan Zhu, Jie Chen, Meng Jiang
cs.AI
초록
대규모 언어 모델(LLM)은 과학적 보조자로서의 잠재력을 가지고 있지만, 기존의 에이전트들은 알고리즘 진화에만 의존하거나 고립된 심층 연구에만 의존하는 방식으로 인해 중요한 한계에 직면해 있습니다. AlphaEvolve와 같은 순수 알고리즘 진화는 LLM의 내부 지식에만 의존하며 복잡한 도메인에서는 빠르게 정체에 이릅니다. 반면, 순수 심층 연구는 검증 없이 아이디어를 제안함으로써 비현실적이거나 구현 불가능한 해결책을 내놓는 경우가 많습니다. 우리는 DeepEvolve를 제안합니다. 이 에이전트는 심층 연구와 알고리즘 진화를 통합하여 외부 지식 검색, 크로스 파일 코드 편집, 그리고 피드백 기반 반복 루프 하에서의 체계적인 디버깅을 결합합니다. 각 반복은 새로운 가설을 제안할 뿐만 아니라 이를 개선, 구현, 테스트함으로써 피상적인 개선과 비생산적인 과도한 정제를 모두 피합니다. 화학, 수학, 생물학, 재료, 특허 등 9개의 벤치마크에서 DeepEvolve는 초기 알고리즘을 지속적으로 개선하며 실행 가능한 새로운 알고리즘을 생성하고 지속적인 성과를 보여줍니다. 무지도적 진화와 근거 없는 연구 사이의 간극을 메우는 DeepEvolve는 과학적 알고리즘 발견을 진전시키기 위한 신뢰할 수 있는 프레임워크를 제공합니다. 우리의 코드는 https://github.com/liugangcode/deepevolve에서 확인할 수 있습니다.
English
Large language models hold promise as scientific assistants, yet existing
agents either rely solely on algorithm evolution or on deep research in
isolation, both of which face critical limitations. Pure algorithm evolution,
as in AlphaEvolve, depends only on the internal knowledge of LLMs and quickly
plateaus in complex domains, while pure deep research proposes ideas without
validation, resulting in unrealistic or unimplementable solutions. We present
DeepEvolve, an agent that integrates deep research with algorithm evolution,
uniting external knowledge retrieval, cross-file code editing, and systematic
debugging under a feedback-driven iterative loop. Each iteration not only
proposes new hypotheses but also refines, implements, and tests them, avoiding
both shallow improvements and unproductive over-refinements. Across nine
benchmarks in chemistry, mathematics, biology, materials, and patents,
DeepEvolve consistently improves the initial algorithm, producing executable
new algorithms with sustained gains. By bridging the gap between unguided
evolution and research without grounding, DeepEvolve provides a reliable
framework for advancing scientific algorithm discovery. Our code is available
at https://github.com/liugangcode/deepevolve.