Imparare ad Apprendere Continuamente tramite Progetti di Memoria Agente basati su Meta-apprendimento

Abstract

La mancanza di stato dei modelli di base rappresenta un collo di bottiglia per la capacità dei sistemi agentivi di apprendere in modo continuativo, un'abilità fondamentale per il ragionamento e l'adattamento a lungo termine. Per affrontare questa limitazione, i sistemi agentivi incorporano comunemente moduli di memoria per conservare e riutilizzare esperienze passate, mirando all'apprendimento continuo durante il periodo di test. Tuttavia, la maggior parte dei progetti di memoria esistenti sono creati manualmente e fissi, il che limita la loro capacità di adattarsi alla diversità e alla non stazionarietà dei compiti del mondo reale. In questo articolo, introduciamo ALMA (Automated meta-Learning of Memory designs for Agentic systems), un framework che meta-apprende progetti di memoria per sostituire quelli progettati manualmente, minimizzando così lo sforzo umano e consentendo ai sistemi agentivi di diventare apprendisti continui in diversi domini. Il nostro approccio impiega un Meta Agente che ricerca progetti di memoria espressi come codice eseguibile in modo aperto, teoricamente consentendo la scoperta di progetti di memoria arbitrari, inclusi schemi di database e i loro meccanismi di recupero e aggiornamento. Esperimenti estesi in quattro domini di decisione sequenziale dimostrano che i progetti di memoria appresi consentono un apprendimento dall'esperienza più efficace ed efficiente rispetto ai progetti di memoria all'avanguardia creati manualmente su tutti i benchmark. Se sviluppato e implementato in sicurezza, ALMA rappresenta un passo verso sistemi di IA auto-miglioranti che imparano a essere apprendisti adattivi e continui.

English

The statelessness of foundation models bottlenecks agentic systems' ability to continually learn, a core capability for long-horizon reasoning and adaptation. To address this limitation, agentic systems commonly incorporate memory modules to retain and reuse past experience, aiming for continual learning during test time. However, most existing memory designs are human-crafted and fixed, which limits their ability to adapt to the diversity and non-stationarity of real-world tasks. In this paper, we introduce ALMA (Automated meta-Learning of Memory designs for Agentic systems), a framework that meta-learns memory designs to replace hand-engineered memory designs, therefore minimizing human effort and enabling agentic systems to be continual learners across diverse domains. Our approach employs a Meta Agent that searches over memory designs expressed as executable code in an open-ended manner, theoretically allowing the discovery of arbitrary memory designs, including database schemas as well as their retrieval and update mechanisms. Extensive experiments across four sequential decision-making domains demonstrate that the learned memory designs enable more effective and efficient learning from experience than state-of-the-art human-crafted memory designs on all benchmarks. When developed and deployed safely, ALMA represents a step toward self-improving AI systems that learn to be adaptive, continual learners.

Imparare ad Apprendere Continuamente tramite Progetti di Memoria Agente basati su Meta-apprendimento

Learning to Continually Learn via Meta-learning Agentic Memory Designs

Abstract

Support