FLEX: Kontinuierliche Agentenentwicklung durch Vorwärtslernen aus Erfahrung
FLEX: Continuous Agent Evolution via Forward Learning from Experience
November 9, 2025
papers.authors: Zhicheng Cai, Xinyuan Guo, Yu Pei, JiangTao Feng, Jiangjie Chen, Ya-Qin Zhang, Wei-Ying Ma, Mingxuan Wang, Hao Zhou
cs.AI
papers.abstract
Autonome Agenten, die von Large Language Models (LLMs) angetrieben werden, haben das Schlussfolgern und Problemlösen revolutioniert, bleiben jedoch nach dem Training statisch und können sich nicht wie intelligente Wesen durch Erfahrung während des Einsatzes weiterentwickeln. Wir stellen Forward Learning with EXperience (FLEX) vor, ein gradientenfreies Lernparadigma, das LLM-Agenten ermöglicht, sich kontinuierlich durch gesammelte Erfahrung weiterzuentwickeln. Konkret fördert FLEX skalierbare und vererbbare Evolution, indem es durch kontinuierliche Reflexion über Erfolge und Misserfolge während der Interaktion mit der Umwelt eine strukturierte Erfahrungsbibliothek aufbaut. FLEX erzielt erhebliche Verbesserungen bei mathematischem Reasoning, chemischer Retrosynthese und Protein-Fitness-Vorhersage (bis zu 23 % bei AIME25, 10 % bei USPTO50k und 14 % bei ProteinGym). Wir identifizieren weiterhin ein klares Skalengesetz des Erfahrungswachstums und das Phänomen der Erfahrungsvererbung zwischen Agenten – ein Schritt hin zu skalierbarer und vererbbarer kontinuierlicher Agentenentwicklung. Projektseite: https://flex-gensi-thuair.github.io.
English
Autonomous agents driven by Large Language Models (LLMs) have revolutionized
reasoning and problem-solving but remain static after training, unable to grow
with experience as intelligent beings do during deployment. We introduce
Forward Learning with EXperience (FLEX), a gradient-free learning paradigm that
enables LLM agents to continuously evolve through accumulated experience.
Specifically, FLEX cultivates scalable and inheritable evolution by
constructing a structured experience library through continual reflection on
successes and failures during interaction with the environment. FLEX delivers
substantial improvements on mathematical reasoning, chemical retrosynthesis,
and protein fitness prediction (up to 23% on AIME25, 10% on USPTO50k, and 14%
on ProteinGym). We further identify a clear scaling law of experiential growth
and the phenomenon of experience inheritance across agents, marking a step
toward scalable and inheritable continuous agent evolution. Project Page:
https://flex-gensi-thuair.github.io.