FLEX: Evolução Contínua de Agentes via Aprendizado Progressivo a partir da Experiência

Resumo

Os agentes autónomos impulsionados por Modelos de Linguagem de Grande Escala (LLMs) revolucionaram o raciocínio e a resolução de problemas, mas permanecem estáticos após o treino, incapazes de evoluir com a experiência, tal como os seres inteligentes fazem durante a sua operação. Apresentamos a Aprendizagem Progressiva com EXperiência (FLEX), um paradigma de aprendizagem sem gradientes que permite aos agentes baseados em LLMs evoluir continuamente através da experiência acumulada. Especificamente, a FLEX cultiva uma evolução escalável e herdável através da construção de uma biblioteca de experiências estruturada, baseada na reflexão contínua sobre sucessos e falhas durante a interação com o ambiente. A FLEX produz melhorias substanciais em raciocínio matemático, retrossíntese química e previsão de aptidão proteica (até 23% no AIME25, 10% no USPTO50k e 14% no ProteinGym). Identificamos ainda uma lei de escala clara do crescimento experiencial e o fenómeno de herança de experiência entre agentes, representando um passo em direção a uma evolução contínua de agentes escalável e herdável. Página do Projeto: https://flex-gensi-thuair.github.io.

English

Autonomous agents driven by Large Language Models (LLMs) have revolutionized reasoning and problem-solving but remain static after training, unable to grow with experience as intelligent beings do during deployment. We introduce Forward Learning with EXperience (FLEX), a gradient-free learning paradigm that enables LLM agents to continuously evolve through accumulated experience. Specifically, FLEX cultivates scalable and inheritable evolution by constructing a structured experience library through continual reflection on successes and failures during interaction with the environment. FLEX delivers substantial improvements on mathematical reasoning, chemical retrosynthesis, and protein fitness prediction (up to 23% on AIME25, 10% on USPTO50k, and 14% on ProteinGym). We further identify a clear scaling law of experiential growth and the phenomenon of experience inheritance across agents, marking a step toward scalable and inheritable continuous agent evolution. Project Page: https://flex-gensi-thuair.github.io.