AlphaResearch : Accélérer la découverte de nouveaux algorithmes grâce aux modèles de langage
AlphaResearch: Accelerating New Algorithm Discovery with Language Models
November 11, 2025
papers.authors: Zhaojian Yu, Kaiyue Feng, Yilun Zhao, Shilin He, Xiao-Ping Zhang, Arman Cohan
cs.AI
papers.abstract
Les modèles de langage à grande échelle ont réalisé des progrès significatifs dans la résolution de problèmes complexes mais faciles à vérifier, mais ils peinent encore à découvrir l'inconnu. Dans cet article, nous présentons AlphaResearch, un agent de recherche autonome conçu pour découvrir de nouveaux algorithmes sur des problèmes ouverts. Pour synergiser la faisabilité et l'innovation du processus de découverte, nous construisons un environnement de recherche dual novateur en combinant la vérification par exécution et un environnement simulé d'évaluation par les pairs réaliste. AlphaResearch découvre de nouveaux algorithmes en exécutant itérativement les étapes suivantes : (1) proposer de nouvelles idées, (2) vérifier les idées dans l'environnement de recherche dual, (3) optimiser les propositions de recherche pour de meilleures performances. Pour promouvoir un processus d'évaluation transparent, nous construisons AlphaResearchComp, un nouveau benchmark d'évaluation comprenant une compétition de huit problèmes algorithmiques ouverts, chaque problème étant soigneusement conçu et vérifié via des pipelines exécutables, des métriques objectives et des vérifications de reproductibilité. AlphaResearch obtient un taux de réussite de 2/8 dans une comparaison directe avec des chercheurs humains, démontrant la possibilité d'accélérer la découverte d'algorithmes avec les LLMs. Notamment, l'algorithme découvert par AlphaResearch sur le problème de « l'emballage de cercles » atteint les meilleures performances connues, surpassant les résultats des chercheurs humains et les solides références de travaux récents (par exemple, AlphaEvolve). De plus, nous menons une analyse complète des défis restants dans les 6/8 cas d'échec, fournissant des perspectives précieuses pour les recherches futures.
English
Large language models have made significant progress in complex but easy-to-verify problems, yet they still struggle with discovering the unknown. In this paper, we present AlphaResearch, an autonomous research agent designed to discover new algorithms on open-ended problems. To synergize the feasibility and innovation of the discovery process, we construct a novel dual research environment by combining the execution-based verify and simulated real-world peer review environment. AlphaResearch discovers new algorithm by iteratively running the following steps: (1) propose new ideas (2) verify the ideas in the dual research environment (3) optimize the research proposals for better performance. To promote a transparent evaluation process, we construct AlphaResearchComp, a new evaluation benchmark that includes an eight open-ended algorithmic problems competition, with each problem carefully curated and verified through executable pipelines, objective metrics, and reproducibility checks. AlphaResearch gets a 2/8 win rate in head-to-head comparison with human researchers, demonstrate the possibility of accelerating algorithm discovery with LLMs. Notably, the algorithm discovered by AlphaResearch on the ``packing circles'' problem achieves the best-of-known performance, surpassing the results of human researchers and strong baselines from recent work (e.g., AlphaEvolve). Additionally, we conduct a comprehensive analysis of the remaining challenges of the 6/8 failure cases, providing valuable insights for future research.