Wetenschappelijk Algoritme Ontdekking door AlphaEvolve te Verrijken met Diepgaand Onderzoek

Samenvatting

Grote taalmodellen bieden veelbelovende mogelijkheden als wetenschappelijke assistenten, maar bestaande agents vertrouwen uitsluitend op algoritme-evolutie of op diepgaand onderzoek in isolatie, waarbij beide benaderingen kritieke beperkingen kennen. Pure algoritme-evolutie, zoals in AlphaEvolve, is alleen afhankelijk van de interne kennis van taalmodellen en bereikt snel een plateau in complexe domeinen, terwijl puur diepgaand onderzoek ideeën voorstelt zonder validatie, wat resulteert in onrealistische of onuitvoerbare oplossingen. Wij presenteren DeepEvolve, een agent die diepgaand onderzoek integreert met algoritme-evolutie, waarbij externe kennisretrieval, cross-file codebewerking en systematisch debuggen worden verenigd in een feedback-gestuurde iteratieve lus. Elke iteratie stelt niet alleen nieuwe hypothesen voor, maar verfijnt, implementeert en test deze ook, waardoor zowel oppervlakkige verbeteringen als onproductieve oververfijningen worden vermeden. Over negen benchmarks in de chemie, wiskunde, biologie, materialen en patenten verbetert DeepEvolve consistent het initiële algoritme, waarbij uitvoerbare nieuwe algoritmen worden geproduceerd met aanhoudende verbeteringen. Door de kloof te overbruggen tussen ongeleide evolutie en onderzoek zonder gronding, biedt DeepEvolve een betrouwbaar raamwerk voor het bevorderen van wetenschappelijke algoritme-ontdekking. Onze code is beschikbaar op https://github.com/liugangcode/deepevolve.

English

Large language models hold promise as scientific assistants, yet existing agents either rely solely on algorithm evolution or on deep research in isolation, both of which face critical limitations. Pure algorithm evolution, as in AlphaEvolve, depends only on the internal knowledge of LLMs and quickly plateaus in complex domains, while pure deep research proposes ideas without validation, resulting in unrealistic or unimplementable solutions. We present DeepEvolve, an agent that integrates deep research with algorithm evolution, uniting external knowledge retrieval, cross-file code editing, and systematic debugging under a feedback-driven iterative loop. Each iteration not only proposes new hypotheses but also refines, implements, and tests them, avoiding both shallow improvements and unproductive over-refinements. Across nine benchmarks in chemistry, mathematics, biology, materials, and patents, DeepEvolve consistently improves the initial algorithm, producing executable new algorithms with sustained gains. By bridging the gap between unguided evolution and research without grounding, DeepEvolve provides a reliable framework for advancing scientific algorithm discovery. Our code is available at https://github.com/liugangcode/deepevolve.

Wetenschappelijk Algoritme Ontdekking door AlphaEvolve te Verrijken met Diepgaand Onderzoek

Scientific Algorithm Discovery by Augmenting AlphaEvolve with Deep Research

Samenvatting

Support