FLEX: Evoluzione Continua degli Agenti tramite Apprendimento in Avanti dall'Esperienza
FLEX: Continuous Agent Evolution via Forward Learning from Experience
November 9, 2025
Autori: Zhicheng Cai, Xinyuan Guo, Yu Pei, JiangTao Feng, Jiangjie Chen, Ya-Qin Zhang, Wei-Ying Ma, Mingxuan Wang, Hao Zhou
cs.AI
Abstract
Gli agenti autonomi guidati da Large Language Model (LLM) hanno rivoluzionato il ragionamento e la risoluzione di problemi, ma rimangono statici dopo l'addestramento, incapaci di evolversi con l'esperienza come fanno gli esseri intelligenti durante il dispiegamento. Introduciamo Forward Learning with EXperience (FLEX), un paradigma di apprendimento senza gradienti che consente agli agenti LLM di evolversi continuamente attraverso l'esperienza accumulata. Nello specifico, FLEX coltiva un'evoluzione scalabile ed ereditabile costruendo una libreria di esperienze strutturata attraverso la riflessione continua su successi e fallimenti durante l'interazione con l'ambiente. FLEX apporta miglioramenti sostanziali nel ragionamento matematico, nella retrosintesi chimica e nella previsione di fitness proteico (fino al 23% su AIME25, 10% su USPTO50k e 14% su ProteinGym). Identifichiamo inoltre una chiara legge di scala della crescita esperienziale e il fenomeno dell'ereditarietà dell'esperienza tra agenti, segnando un passo verso un'evoluzione continua degli agenti scalabile ed ereditabile. Pagina del progetto: https://flex-gensi-thuair.github.io.
English
Autonomous agents driven by Large Language Models (LLMs) have revolutionized
reasoning and problem-solving but remain static after training, unable to grow
with experience as intelligent beings do during deployment. We introduce
Forward Learning with EXperience (FLEX), a gradient-free learning paradigm that
enables LLM agents to continuously evolve through accumulated experience.
Specifically, FLEX cultivates scalable and inheritable evolution by
constructing a structured experience library through continual reflection on
successes and failures during interaction with the environment. FLEX delivers
substantial improvements on mathematical reasoning, chemical retrosynthesis,
and protein fitness prediction (up to 23% on AIME25, 10% on USPTO50k, and 14%
on ProteinGym). We further identify a clear scaling law of experiential growth
and the phenomenon of experience inheritance across agents, marking a step
toward scalable and inheritable continuous agent evolution. Project Page:
https://flex-gensi-thuair.github.io.