ChatPaper.aiChatPaper

FLEX: 経験からの順方向学習による継続的エージェント進化

FLEX: Continuous Agent Evolution via Forward Learning from Experience

November 9, 2025
著者: Zhicheng Cai, Xinyuan Guo, Yu Pei, JiangTao Feng, Jiangjie Chen, Ya-Qin Zhang, Wei-Ying Ma, Mingxuan Wang, Hao Zhou
cs.AI

要旨

大規模言語モデル(LLM)によって駆動される自律エージェントは、推論と問題解決に革命をもたらしたが、学習後は静的であり、知的生命体のようにデプロイ中の経験を通じて成長することができない。本論文では、経験の蓄積を通じてLLMエージェントが継続的に進化することを可能にする、勾配不要の学習パラダイムであるForward Learning with EXperience(FLEX)を提案する。具体的には、FLEXは環境との相互作用中の成功と失敗に対する継続的な省察を通じて構造化された経験ライブラリを構築し、スケーラブルで継承可能な進化を促進する。FLEXは、数学的推論、化学的逆合成、タンパク質適合性予測において大幅な改善をもたらした(AIME25で最大23%、USPTO50kで10%、ProteinGymで14%)。さらに、経験的成長の明確なスケーリング則と、エージェント間での経験継承の現象を確認し、スケーラブルで継承可能な継続的エージェント進化への一歩を記す。プロジェクトページ:https://flex-gensi-thuair.github.io。
English
Autonomous agents driven by Large Language Models (LLMs) have revolutionized reasoning and problem-solving but remain static after training, unable to grow with experience as intelligent beings do during deployment. We introduce Forward Learning with EXperience (FLEX), a gradient-free learning paradigm that enables LLM agents to continuously evolve through accumulated experience. Specifically, FLEX cultivates scalable and inheritable evolution by constructing a structured experience library through continual reflection on successes and failures during interaction with the environment. FLEX delivers substantial improvements on mathematical reasoning, chemical retrosynthesis, and protein fitness prediction (up to 23% on AIME25, 10% on USPTO50k, and 14% on ProteinGym). We further identify a clear scaling law of experiential growth and the phenomenon of experience inheritance across agents, marking a step toward scalable and inheritable continuous agent evolution. Project Page: https://flex-gensi-thuair.github.io.
PDF112December 2, 2025