AriGraph: Apprendimento di Modelli del Mondo su Grafi di Conoscenza con Memoria Episodica per Agenti LLM

Abstract

I progressi nell'IA generativa hanno ampliato le potenziali applicazioni dei Modelli Linguistici di Grande Scala (LLM) nello sviluppo di agenti autonomi. Raggiungere una vera autonomia richiede l'accumulazione e l'aggiornamento delle conoscenze acquisite dalle interazioni con l'ambiente e il loro utilizzo efficace. Gli approcci attuali basati su LLM sfruttano esperienze passate utilizzando una cronologia completa delle osservazioni, la sintesi o l'aumento tramite recupero. Tuttavia, queste rappresentazioni di memoria non strutturate non facilitano il ragionamento e la pianificazione essenziali per il processo decisionale complesso. Nel nostro studio, introduciamo AriGraph, un metodo innovativo in cui l'agente costruisce un grafo di memoria che integra ricordi semantici ed episodici mentre esplora l'ambiente. Questa struttura a grafo facilita un recupero associativo efficiente di concetti interconnessi, rilevanti per lo stato attuale e gli obiettivi dell'agente, fungendo così come un modello ambientale efficace che potenzia le capacità esplorative e di pianificazione dell'agente. Dimostriamo che il nostro agente LLM Ariadne, dotato di questa architettura di memoria proposta e arricchita con pianificazione e processo decisionale, gestisce efficacemente compiti complessi in modalità zero-shot nell'ambiente TextWorld. Il nostro approccio supera nettamente metodi consolidati come la cronologia completa, la sintesi e la Generazione Aumentata tramite Recupero in vari compiti, inclusa la sfida culinaria della competizione First TextWorld Problems e nuovi compiti come la pulizia della casa e la caccia al tesoro con enigmi.

English

Advancements in generative AI have broadened the potential applications of Large Language Models (LLMs) in the development of autonomous agents. Achieving true autonomy requires accumulating and updating knowledge gained from interactions with the environment and effectively utilizing it. Current LLM-based approaches leverage past experiences using a full history of observations, summarization or retrieval augmentation. However, these unstructured memory representations do not facilitate the reasoning and planning essential for complex decision-making. In our study, we introduce AriGraph, a novel method wherein the agent constructs a memory graph that integrates semantic and episodic memories while exploring the environment. This graph structure facilitates efficient associative retrieval of interconnected concepts, relevant to the agent's current state and goals, thus serving as an effective environmental model that enhances the agent's exploratory and planning capabilities. We demonstrate that our Ariadne LLM agent, equipped with this proposed memory architecture augmented with planning and decision-making, effectively handles complex tasks on a zero-shot basis in the TextWorld environment. Our approach markedly outperforms established methods such as full-history, summarization, and Retrieval-Augmented Generation in various tasks, including the cooking challenge from the First TextWorld Problems competition and novel tasks like house cleaning and puzzle Treasure Hunting.

AriGraph: Apprendimento di Modelli del Mondo su Grafi di Conoscenza con Memoria Episodica per Agenti LLM

AriGraph: Learning Knowledge Graph World Models with Episodic Memory for LLM Agents

Abstract

Support