ChatPaper.aiChatPaper

FLEX : Évolution continue des agents par apprentissage prospectif à partir de l'expérience

FLEX: Continuous Agent Evolution via Forward Learning from Experience

November 9, 2025
papers.authors: Zhicheng Cai, Xinyuan Guo, Yu Pei, JiangTao Feng, Jiangjie Chen, Ya-Qin Zhang, Wei-Ying Ma, Mingxuan Wang, Hao Zhou
cs.AI

papers.abstract

Les agents autonomes pilotés par les modèles de langage de grande taille (LLM) ont révolutionné le raisonnement et la résolution de problèmes, mais ils restent statiques après leur entraînement, incapables de progresser par l'expérience comme le font les êtres intelligents lors de leur déploiement. Nous présentons l'apprentissage prospectif par expérience (FLEX), un paradigme d'apprentissage sans gradient qui permet aux agents LLM d'évoluer continuellement grâce à l'accumulation d'expériences. Concrètement, FLEX cultive une évolution évolutive et héritable en construisant une bibliothèque d'expériences structurée grâce à une réflexion continue sur les succès et les échecs lors de l'interaction avec l'environnement. FLEX apporte des améliorations substantielles en raisonnement mathématique, rétrosynthèse chimique et prédiction de fitness protéique (jusqu'à 23% sur AIME25, 10% sur USPTO50k et 14% sur ProteinGym). Nous identifions en outre une loi d'échelle claire de la croissance expérientielle et le phénomène d'héritage d'expérience entre agents, marquant un pas vers une évolution continue d'agents évolutive et héritable. Page du projet : https://flex-gensi-thuair.github.io.
English
Autonomous agents driven by Large Language Models (LLMs) have revolutionized reasoning and problem-solving but remain static after training, unable to grow with experience as intelligent beings do during deployment. We introduce Forward Learning with EXperience (FLEX), a gradient-free learning paradigm that enables LLM agents to continuously evolve through accumulated experience. Specifically, FLEX cultivates scalable and inheritable evolution by constructing a structured experience library through continual reflection on successes and failures during interaction with the environment. FLEX delivers substantial improvements on mathematical reasoning, chemical retrosynthesis, and protein fitness prediction (up to 23% on AIME25, 10% on USPTO50k, and 14% on ProteinGym). We further identify a clear scaling law of experiential growth and the phenomenon of experience inheritance across agents, marking a step toward scalable and inheritable continuous agent evolution. Project Page: https://flex-gensi-thuair.github.io.
PDF112December 2, 2025