メタ学習によるエージェント的記憶設計を用いた継続的学習の実現
Learning to Continually Learn via Meta-learning Agentic Memory Designs
February 8, 2026
著者: Yiming Xiong, Shengran Hu, Jeff Clune
cs.AI
要旨
基盤モデルのステートレス性は、長期的な推論と適応の中核能力である継続的学習能力をエージェントシステムが発揮する上でのボトルネックとなっている。この制限に対処するため、エージェントシステムは一般にメモリモジュールを組み込み、過去の経験を保持・再利用することで、テスト時間中の継続的学習を目指す。しかし、既存のメモリ設計の多くは人手によって作成され固定されているため、実世界タスクの多様性と非定常性に適応する能力が制限されている。本論文では、ALMA(Automated meta-Learning of Memory designs for Agentic systems)を提案する。これは、人手で設計されたメモリ設計を置き換えるためにメタ学習によりメモリ設計を獲得するフレームワークであり、人的労力を最小化するとともに、エージェントシステムが様々な領域にわたって継続的学習者となることを可能にする。我々のアプローチでは、メタエージェントが実行可能なコードとして表現されたメモリ設計をオープンエンドに探索し、データベーススキーマやその検索・更新メカニズムを含む任意のメモリ設計の発見を理論的に可能とする。4つの逐次意思決定領域における大規模な実験により、学習されたメモリ設計が、全てのベンチマークにおいて最先端の人手設計メモリ設計よりも経験からより効果的かつ効率的に学習できることを実証する。安全に開発・展開されれば、ALMAは、適応的かつ継続的な学習者となることを学習する自己改善型AIシステムへの一歩を表すものである。
English
The statelessness of foundation models bottlenecks agentic systems' ability to continually learn, a core capability for long-horizon reasoning and adaptation. To address this limitation, agentic systems commonly incorporate memory modules to retain and reuse past experience, aiming for continual learning during test time. However, most existing memory designs are human-crafted and fixed, which limits their ability to adapt to the diversity and non-stationarity of real-world tasks. In this paper, we introduce ALMA (Automated meta-Learning of Memory designs for Agentic systems), a framework that meta-learns memory designs to replace hand-engineered memory designs, therefore minimizing human effort and enabling agentic systems to be continual learners across diverse domains. Our approach employs a Meta Agent that searches over memory designs expressed as executable code in an open-ended manner, theoretically allowing the discovery of arbitrary memory designs, including database schemas as well as their retrieval and update mechanisms. Extensive experiments across four sequential decision-making domains demonstrate that the learned memory designs enable more effective and efficient learning from experience than state-of-the-art human-crafted memory designs on all benchmarks. When developed and deployed safely, ALMA represents a step toward self-improving AI systems that learn to be adaptive, continual learners.