ChatPaper.aiChatPaper

FLEX: Evoluzione Continua degli Agenti tramite Apprendimento in Avanti dall'Esperienza

FLEX: Continuous Agent Evolution via Forward Learning from Experience

November 9, 2025
Autori: Zhicheng Cai, Xinyuan Guo, Yu Pei, JiangTao Feng, Jiangjie Chen, Ya-Qin Zhang, Wei-Ying Ma, Mingxuan Wang, Hao Zhou
cs.AI

Abstract

Gli agenti autonomi guidati da Large Language Model (LLM) hanno rivoluzionato il ragionamento e la risoluzione di problemi, ma rimangono statici dopo l'addestramento, incapaci di evolversi con l'esperienza come fanno gli esseri intelligenti durante il dispiegamento. Introduciamo Forward Learning with EXperience (FLEX), un paradigma di apprendimento senza gradienti che consente agli agenti LLM di evolversi continuamente attraverso l'esperienza accumulata. Nello specifico, FLEX coltiva un'evoluzione scalabile ed ereditabile costruendo una libreria di esperienze strutturata attraverso la riflessione continua su successi e fallimenti durante l'interazione con l'ambiente. FLEX apporta miglioramenti sostanziali nel ragionamento matematico, nella retrosintesi chimica e nella previsione di fitness proteico (fino al 23% su AIME25, 10% su USPTO50k e 14% su ProteinGym). Identifichiamo inoltre una chiara legge di scala della crescita esperienziale e il fenomeno dell'ereditarietà dell'esperienza tra agenti, segnando un passo verso un'evoluzione continua degli agenti scalabile ed ereditabile. Pagina del progetto: https://flex-gensi-thuair.github.io.
English
Autonomous agents driven by Large Language Models (LLMs) have revolutionized reasoning and problem-solving but remain static after training, unable to grow with experience as intelligent beings do during deployment. We introduce Forward Learning with EXperience (FLEX), a gradient-free learning paradigm that enables LLM agents to continuously evolve through accumulated experience. Specifically, FLEX cultivates scalable and inheritable evolution by constructing a structured experience library through continual reflection on successes and failures during interaction with the environment. FLEX delivers substantial improvements on mathematical reasoning, chemical retrosynthesis, and protein fitness prediction (up to 23% on AIME25, 10% on USPTO50k, and 14% on ProteinGym). We further identify a clear scaling law of experiential growth and the phenomenon of experience inheritance across agents, marking a step toward scalable and inheritable continuous agent evolution. Project Page: https://flex-gensi-thuair.github.io.
PDF112December 2, 2025