ChatPaper.aiChatPaper

FLEX: Evolución Continua de Agentes mediante Aprendizaje Directo a partir de la Experiencia

FLEX: Continuous Agent Evolution via Forward Learning from Experience

November 9, 2025
Autores: Zhicheng Cai, Xinyuan Guo, Yu Pei, JiangTao Feng, Jiangjie Chen, Ya-Qin Zhang, Wei-Ying Ma, Mingxuan Wang, Hao Zhou
cs.AI

Resumen

Los agentes autónomos impulsados por Modelos de Lenguaje a Gran Escala (LLMs) han revolucionado el razonamiento y la resolución de problemas, pero permanecen estáticos después del entrenamiento, incapaces de crecer con la experiencia como lo hacen los seres inteligentes durante su despliegue. Presentamos Forward Learning with EXperience (FLEX), un paradigma de aprendizaje sin gradientes que permite a los agentes de LLMs evolucionar continuamente mediante la experiencia acumulada. Específicamente, FLEX cultiva una evolución escalable y heredable mediante la construcción de una biblioteca de experiencias estructurada a través de la reflexión continua sobre los éxitos y fracasos durante la interacción con el entorno. FLEX proporciona mejoras sustanciales en razonamiento matemático, retrosíntesis química y predicción de aptitud proteica (hasta un 23% en AIME25, 10% en USPTO50k y 14% en ProteinGym). Además, identificamos una clara ley de escalamiento del crecimiento experiencial y el fenómeno de la herencia de experiencia entre agentes, lo que marca un paso hacia una evolución continua de agentes escalable y heredable. Página del proyecto: https://flex-gensi-thuair.github.io.
English
Autonomous agents driven by Large Language Models (LLMs) have revolutionized reasoning and problem-solving but remain static after training, unable to grow with experience as intelligent beings do during deployment. We introduce Forward Learning with EXperience (FLEX), a gradient-free learning paradigm that enables LLM agents to continuously evolve through accumulated experience. Specifically, FLEX cultivates scalable and inheritable evolution by constructing a structured experience library through continual reflection on successes and failures during interaction with the environment. FLEX delivers substantial improvements on mathematical reasoning, chemical retrosynthesis, and protein fitness prediction (up to 23% on AIME25, 10% on USPTO50k, and 14% on ProteinGym). We further identify a clear scaling law of experiential growth and the phenomenon of experience inheritance across agents, marking a step toward scalable and inheritable continuous agent evolution. Project Page: https://flex-gensi-thuair.github.io.
PDF142February 7, 2026