ChatPaper.aiChatPaper

AlphaResearch: Aceleración del Descubrimiento de Nuevos Algoritmos mediante Modelos de Lenguaje

AlphaResearch: Accelerating New Algorithm Discovery with Language Models

November 11, 2025
Autores: Zhaojian Yu, Kaiyue Feng, Yilun Zhao, Shilin He, Xiao-Ping Zhang, Arman Cohan
cs.AI

Resumen

Los modelos de lenguaje a gran escala han logrado avances significativos en problemas complejos pero fáciles de verificar, aunque aún presentan dificultades para descubrir lo desconocido. En este artículo presentamos AlphaResearch, un agente de investigación autónomo diseñado para descubrir nuevos algoritmos en problemas de carácter abierto. Para sinergizar la viabilidad e innovación del proceso de descubrimiento, construimos un novedoso entorno de investigación dual combinando la verificación basada en ejecución con un entorno simulado de revisión por pares del mundo real. AlphaResearch descubre nuevos algoritmos ejecutando iterativamente los siguientes pasos: (1) proponer nuevas ideas, (2) verificar las ideas en el entorno de investigación dual, (3) optimizar las propuestas de investigación para mejorar el rendimiento. Para promover un proceso de evaluación transparente, creamos AlphaResearchComp, un nuevo benchmark de evaluación que incluye una competición de ocho problemas algorítmicos abiertos, donde cada problema ha sido cuidadosamente seleccionado y verificado mediante pipelines ejecutables, métricas objetivas y comprobaciones de reproducibilidad. AlphaResearch obtiene una tasa de éxito de 2/8 en comparaciones directas con investigadores humanos, demostrando la posibilidad de acelerar el descubrimiento de algoritmos con modelos de lenguaje. Cabe destacar que el algoritmo descubierto por AlphaResearch en el problema de "empaquetamiento de círculos" logra el mejor rendimiento conocido, superando los resultados de investigadores humanos y fuertes líneas base de trabajos recientes (por ejemplo, AlphaEvolve). Adicionalmente, realizamos un análisis exhaustivo de los desafíos pendientes en los 6/8 casos de fracaso, proporcionando insights valiosos para futuras investigaciones.
English
Large language models have made significant progress in complex but easy-to-verify problems, yet they still struggle with discovering the unknown. In this paper, we present AlphaResearch, an autonomous research agent designed to discover new algorithms on open-ended problems. To synergize the feasibility and innovation of the discovery process, we construct a novel dual research environment by combining the execution-based verify and simulated real-world peer review environment. AlphaResearch discovers new algorithm by iteratively running the following steps: (1) propose new ideas (2) verify the ideas in the dual research environment (3) optimize the research proposals for better performance. To promote a transparent evaluation process, we construct AlphaResearchComp, a new evaluation benchmark that includes an eight open-ended algorithmic problems competition, with each problem carefully curated and verified through executable pipelines, objective metrics, and reproducibility checks. AlphaResearch gets a 2/8 win rate in head-to-head comparison with human researchers, demonstrate the possibility of accelerating algorithm discovery with LLMs. Notably, the algorithm discovered by AlphaResearch on the ``packing circles'' problem achieves the best-of-known performance, surpassing the results of human researchers and strong baselines from recent work (e.g., AlphaEvolve). Additionally, we conduct a comprehensive analysis of the remaining challenges of the 6/8 failure cases, providing valuable insights for future research.
PDF152December 1, 2025