ChatPaper.aiChatPaper

AlphaResearch: Accelerare la Scoperta di Nuovi Algoritmi con i Modelli Linguistici

AlphaResearch: Accelerating New Algorithm Discovery with Language Models

November 11, 2025
Autori: Zhaojian Yu, Kaiyue Feng, Yilun Zhao, Shilin He, Xiao-Ping Zhang, Arman Cohan
cs.AI

Abstract

I modelli linguistici di grandi dimensioni hanno compiuto progressi significativi in problemi complessi ma facili da verificare, ma continuano a lottare con la scoperta dell'ignoto. In questo articolo presentiamo AlphaResearch, un agente di ricerca autonomo progettato per scoprire nuovi algoritmi su problemi aperti. Per sinergizzare fattibilità e innovazione nel processo di scoperta, costruiamo un ambiente di ricerca duale innovativo combinando la verifica basata sull'esecuzione con un ambiente simulato di revisione paritaria del mondo reale. AlphaResearch scopre nuovi algoritmi eseguendo iterativamente i seguenti passi: (1) proporre nuove idee, (2) verificare le idee nell'ambiente di ricerca duale, (3) ottimizzare le proposte di ricerca per ottenere prestazioni migliori. Per promuovere un processo di valutazione trasparente, costruiamo AlphaResearchComp, un nuovo benchmark di valutazione che include una competizione su otto problemi algoritmici aperti, con ciascun problema accuratamente curato e verificato attraverso pipeline eseguibili, metriche oggettive e controlli di riproducibilità. AlphaResearch ottiene un tasso di vittoria del 2/8 in un confronto diretto con ricercatori umani, dimostrando la possibilità di accelerare la scoperta di algoritmi con i LLM. Notevolmente, l'algoritmo scoperto da AlphaResearch sul problema del "impacchettamento di cerchi" raggiunge le migliori prestazioni conosciute, superando i risultati dei ricercatori umani e i forti baseline di lavori recenti (ad esempio, AlphaEvolve). Inoltre, conduciamo un'analisi completa delle sfide rimanenti nei 6/8 casi di fallimento, fornendo spunti preziosi per la ricerca futura.
English
Large language models have made significant progress in complex but easy-to-verify problems, yet they still struggle with discovering the unknown. In this paper, we present AlphaResearch, an autonomous research agent designed to discover new algorithms on open-ended problems. To synergize the feasibility and innovation of the discovery process, we construct a novel dual research environment by combining the execution-based verify and simulated real-world peer review environment. AlphaResearch discovers new algorithm by iteratively running the following steps: (1) propose new ideas (2) verify the ideas in the dual research environment (3) optimize the research proposals for better performance. To promote a transparent evaluation process, we construct AlphaResearchComp, a new evaluation benchmark that includes an eight open-ended algorithmic problems competition, with each problem carefully curated and verified through executable pipelines, objective metrics, and reproducibility checks. AlphaResearch gets a 2/8 win rate in head-to-head comparison with human researchers, demonstrate the possibility of accelerating algorithm discovery with LLMs. Notably, the algorithm discovered by AlphaResearch on the ``packing circles'' problem achieves the best-of-known performance, surpassing the results of human researchers and strong baselines from recent work (e.g., AlphaEvolve). Additionally, we conduct a comprehensive analysis of the remaining challenges of the 6/8 failure cases, providing valuable insights for future research.
PDF152December 1, 2025