FLEX: Evolução Contínua de Agentes via Aprendizado Progressivo a partir da Experiência
FLEX: Continuous Agent Evolution via Forward Learning from Experience
November 9, 2025
Autores: Zhicheng Cai, Xinyuan Guo, Yu Pei, JiangTao Feng, Jiangjie Chen, Ya-Qin Zhang, Wei-Ying Ma, Mingxuan Wang, Hao Zhou
cs.AI
Resumo
Os agentes autónomos impulsionados por Modelos de Linguagem de Grande Escala (LLMs) revolucionaram o raciocínio e a resolução de problemas, mas permanecem estáticos após o treino, incapazes de evoluir com a experiência, tal como os seres inteligentes fazem durante a sua operação. Apresentamos a Aprendizagem Progressiva com EXperiência (FLEX), um paradigma de aprendizagem sem gradientes que permite aos agentes baseados em LLMs evoluir continuamente através da experiência acumulada. Especificamente, a FLEX cultiva uma evolução escalável e herdável através da construção de uma biblioteca de experiências estruturada, baseada na reflexão contínua sobre sucessos e falhas durante a interação com o ambiente. A FLEX produz melhorias substanciais em raciocínio matemático, retrossíntese química e previsão de aptidão proteica (até 23% no AIME25, 10% no USPTO50k e 14% no ProteinGym). Identificamos ainda uma lei de escala clara do crescimento experiencial e o fenómeno de herança de experiência entre agentes, representando um passo em direção a uma evolução contínua de agentes escalável e herdável. Página do Projeto: https://flex-gensi-thuair.github.io.
English
Autonomous agents driven by Large Language Models (LLMs) have revolutionized
reasoning and problem-solving but remain static after training, unable to grow
with experience as intelligent beings do during deployment. We introduce
Forward Learning with EXperience (FLEX), a gradient-free learning paradigm that
enables LLM agents to continuously evolve through accumulated experience.
Specifically, FLEX cultivates scalable and inheritable evolution by
constructing a structured experience library through continual reflection on
successes and failures during interaction with the environment. FLEX delivers
substantial improvements on mathematical reasoning, chemical retrosynthesis,
and protein fitness prediction (up to 23% on AIME25, 10% on USPTO50k, and 14%
on ProteinGym). We further identify a clear scaling law of experiential growth
and the phenomenon of experience inheritance across agents, marking a step
toward scalable and inheritable continuous agent evolution. Project Page:
https://flex-gensi-thuair.github.io.