Wetenschappelijk Algoritme Ontdekking door AlphaEvolve te Verrijken met Diepgaand Onderzoek
Scientific Algorithm Discovery by Augmenting AlphaEvolve with Deep Research
October 7, 2025
Auteurs: Gang Liu, Yihan Zhu, Jie Chen, Meng Jiang
cs.AI
Samenvatting
Grote taalmodellen bieden veelbelovende mogelijkheden als wetenschappelijke assistenten, maar bestaande agents vertrouwen uitsluitend op algoritme-evolutie of op diepgaand onderzoek in isolatie, waarbij beide benaderingen kritieke beperkingen kennen. Pure algoritme-evolutie, zoals in AlphaEvolve, is alleen afhankelijk van de interne kennis van taalmodellen en bereikt snel een plateau in complexe domeinen, terwijl puur diepgaand onderzoek ideeën voorstelt zonder validatie, wat resulteert in onrealistische of onuitvoerbare oplossingen. Wij presenteren DeepEvolve, een agent die diepgaand onderzoek integreert met algoritme-evolutie, waarbij externe kennisretrieval, cross-file codebewerking en systematisch debuggen worden verenigd in een feedback-gestuurde iteratieve lus. Elke iteratie stelt niet alleen nieuwe hypothesen voor, maar verfijnt, implementeert en test deze ook, waardoor zowel oppervlakkige verbeteringen als onproductieve oververfijningen worden vermeden. Over negen benchmarks in de chemie, wiskunde, biologie, materialen en patenten verbetert DeepEvolve consistent het initiële algoritme, waarbij uitvoerbare nieuwe algoritmen worden geproduceerd met aanhoudende verbeteringen. Door de kloof te overbruggen tussen ongeleide evolutie en onderzoek zonder gronding, biedt DeepEvolve een betrouwbaar raamwerk voor het bevorderen van wetenschappelijke algoritme-ontdekking. Onze code is beschikbaar op https://github.com/liugangcode/deepevolve.
English
Large language models hold promise as scientific assistants, yet existing
agents either rely solely on algorithm evolution or on deep research in
isolation, both of which face critical limitations. Pure algorithm evolution,
as in AlphaEvolve, depends only on the internal knowledge of LLMs and quickly
plateaus in complex domains, while pure deep research proposes ideas without
validation, resulting in unrealistic or unimplementable solutions. We present
DeepEvolve, an agent that integrates deep research with algorithm evolution,
uniting external knowledge retrieval, cross-file code editing, and systematic
debugging under a feedback-driven iterative loop. Each iteration not only
proposes new hypotheses but also refines, implements, and tests them, avoiding
both shallow improvements and unproductive over-refinements. Across nine
benchmarks in chemistry, mathematics, biology, materials, and patents,
DeepEvolve consistently improves the initial algorithm, producing executable
new algorithms with sustained gains. By bridging the gap between unguided
evolution and research without grounding, DeepEvolve provides a reliable
framework for advancing scientific algorithm discovery. Our code is available
at https://github.com/liugangcode/deepevolve.