Aprendendo a Aprender Continuamente via Projetos de Memória Agêntica Baseados em Meta-aprendizagem

Resumo

A ausência de estado (*statelessness*) dos modelos de base constitui um gargalo para a capacidade dos sistemas agentivos de aprenderem continuamente, uma capacidade fundamental para o raciocínio e adaptação de longo prazo. Para superar esta limitação, os sistemas agentivos incorporam frequentemente módulos de memória para reter e reutilizar experiências passadas, visando a aprendizagem contínua durante o tempo de teste. No entanto, a maioria dos projetos de memória existentes são definidos manualmente e fixos, o que limita a sua capacidade de se adaptarem à diversidade e não estacionariedade das tarefas do mundo real. Neste artigo, introduzimos a ALMA (*Automated meta-Learning of Memory designs for Agentic systems*), uma estrutura que meta-aprende projetos de memória para substituir os projetos manuais, minimizando assim o esforço humano e permitindo que os sistemas agentivos se tornem aprendizes contínuos em diversos domínios. A nossa abordagem emprega um Meta-Agente que pesquisa projetos de memória expressos como código executável de forma aberta, permitindo teoricamente a descoberta de projetos de memória arbitrários, incluindo esquemas de base de dados, bem como os seus mecanismos de recuperação e atualização. Experiências extensas em quatro domínios de tomada de decisão sequencial demonstram que os projetos de memória aprendidos permitem uma aprendizagem mais eficaz e eficiente a partir da experiência do que os projetos de memória manuais mais avançados em todos os benchmarks. Quando desenvolvida e implementada com segurança, a ALMA representa um passo em direção a sistemas de IA que se autoaprimoram, aprendendo a ser aprendizes adaptativos e contínuos.

English

The statelessness of foundation models bottlenecks agentic systems' ability to continually learn, a core capability for long-horizon reasoning and adaptation. To address this limitation, agentic systems commonly incorporate memory modules to retain and reuse past experience, aiming for continual learning during test time. However, most existing memory designs are human-crafted and fixed, which limits their ability to adapt to the diversity and non-stationarity of real-world tasks. In this paper, we introduce ALMA (Automated meta-Learning of Memory designs for Agentic systems), a framework that meta-learns memory designs to replace hand-engineered memory designs, therefore minimizing human effort and enabling agentic systems to be continual learners across diverse domains. Our approach employs a Meta Agent that searches over memory designs expressed as executable code in an open-ended manner, theoretically allowing the discovery of arbitrary memory designs, including database schemas as well as their retrieval and update mechanisms. Extensive experiments across four sequential decision-making domains demonstrate that the learned memory designs enable more effective and efficient learning from experience than state-of-the-art human-crafted memory designs on all benchmarks. When developed and deployed safely, ALMA represents a step toward self-improving AI systems that learn to be adaptive, continual learners.

Aprendendo a Aprender Continuamente via Projetos de Memória Agêntica Baseados em Meta-aprendizagem

Learning to Continually Learn via Meta-learning Agentic Memory Designs

Resumo

Support