ChatPaper.aiChatPaper

FLEX: Kontinuierliche Agentenentwicklung durch Vorwärtslernen aus Erfahrung

FLEX: Continuous Agent Evolution via Forward Learning from Experience

November 9, 2025
papers.authors: Zhicheng Cai, Xinyuan Guo, Yu Pei, JiangTao Feng, Jiangjie Chen, Ya-Qin Zhang, Wei-Ying Ma, Mingxuan Wang, Hao Zhou
cs.AI

papers.abstract

Autonome Agenten, die von Large Language Models (LLMs) angetrieben werden, haben das Schlussfolgern und Problemlösen revolutioniert, bleiben jedoch nach dem Training statisch und können sich nicht wie intelligente Wesen durch Erfahrung während des Einsatzes weiterentwickeln. Wir stellen Forward Learning with EXperience (FLEX) vor, ein gradientenfreies Lernparadigma, das LLM-Agenten ermöglicht, sich kontinuierlich durch gesammelte Erfahrung weiterzuentwickeln. Konkret fördert FLEX skalierbare und vererbbare Evolution, indem es durch kontinuierliche Reflexion über Erfolge und Misserfolge während der Interaktion mit der Umwelt eine strukturierte Erfahrungsbibliothek aufbaut. FLEX erzielt erhebliche Verbesserungen bei mathematischem Reasoning, chemischer Retrosynthese und Protein-Fitness-Vorhersage (bis zu 23 % bei AIME25, 10 % bei USPTO50k und 14 % bei ProteinGym). Wir identifizieren weiterhin ein klares Skalengesetz des Erfahrungswachstums und das Phänomen der Erfahrungsvererbung zwischen Agenten – ein Schritt hin zu skalierbarer und vererbbarer kontinuierlicher Agentenentwicklung. Projektseite: https://flex-gensi-thuair.github.io.
English
Autonomous agents driven by Large Language Models (LLMs) have revolutionized reasoning and problem-solving but remain static after training, unable to grow with experience as intelligent beings do during deployment. We introduce Forward Learning with EXperience (FLEX), a gradient-free learning paradigm that enables LLM agents to continuously evolve through accumulated experience. Specifically, FLEX cultivates scalable and inheritable evolution by constructing a structured experience library through continual reflection on successes and failures during interaction with the environment. FLEX delivers substantial improvements on mathematical reasoning, chemical retrosynthesis, and protein fitness prediction (up to 23% on AIME25, 10% on USPTO50k, and 14% on ProteinGym). We further identify a clear scaling law of experiential growth and the phenomenon of experience inheritance across agents, marking a step toward scalable and inheritable continuous agent evolution. Project Page: https://flex-gensi-thuair.github.io.
PDF142February 7, 2026