ChatPaper.aiChatPaper

AriGraph: Aprendizaje de Modelos del Mundo de Grafos de Conocimiento con Memoria Episódica para Agentes LLM

AriGraph: Learning Knowledge Graph World Models with Episodic Memory for LLM Agents

July 5, 2024
Autores: Petr Anokhin, Nikita Semenov, Artyom Sorokin, Dmitry Evseev, Mikhail Burtsev, Evgeny Burnaev
cs.AI

Resumen

Los avances en la inteligencia artificial generativa han ampliado las posibles aplicaciones de los Modelos de Lenguaje Extensos (MLE) en el desarrollo de agentes autónomos. Lograr una verdadera autonomía requiere acumular y actualizar el conocimiento adquirido a través de interacciones con el entorno y utilizarlo de manera efectiva. Los enfoques actuales basados en MLE aprovechan experiencias pasadas utilizando un historial completo de observaciones, resumen o mejora de recuperación. Sin embargo, estas representaciones de memoria no estructuradas no facilitan el razonamiento y la planificación necesarios para la toma de decisiones complejas. En nuestro estudio, presentamos AriGraph, un método novedoso en el cual el agente construye un grafo de memoria que integra memorias semánticas y episódicas mientras explora el entorno. Esta estructura de grafo facilita la recuperación asociativa eficiente de conceptos interconectados, relevantes para el estado actual y los objetivos del agente, sirviendo así como un modelo ambiental efectivo que mejora las capacidades exploratorias y de planificación del agente. Demostramos que nuestro agente Ariadne LLE, equipado con esta arquitectura de memoria propuesta mejorada con planificación y toma de decisiones, maneja eficazmente tareas complejas de manera directa en el entorno TextWorld. Nuestro enfoque supera notablemente a métodos establecidos como historial completo, resumen y Generación con Recuperación Mejorada en diversas tareas, incluida el desafío de cocina de la competencia First TextWorld Problems y tareas novedosas como limpieza de casas y búsqueda de tesoros en rompecabezas.
English
Advancements in generative AI have broadened the potential applications of Large Language Models (LLMs) in the development of autonomous agents. Achieving true autonomy requires accumulating and updating knowledge gained from interactions with the environment and effectively utilizing it. Current LLM-based approaches leverage past experiences using a full history of observations, summarization or retrieval augmentation. However, these unstructured memory representations do not facilitate the reasoning and planning essential for complex decision-making. In our study, we introduce AriGraph, a novel method wherein the agent constructs a memory graph that integrates semantic and episodic memories while exploring the environment. This graph structure facilitates efficient associative retrieval of interconnected concepts, relevant to the agent's current state and goals, thus serving as an effective environmental model that enhances the agent's exploratory and planning capabilities. We demonstrate that our Ariadne LLM agent, equipped with this proposed memory architecture augmented with planning and decision-making, effectively handles complex tasks on a zero-shot basis in the TextWorld environment. Our approach markedly outperforms established methods such as full-history, summarization, and Retrieval-Augmented Generation in various tasks, including the cooking challenge from the First TextWorld Problems competition and novel tasks like house cleaning and puzzle Treasure Hunting.

Summary

AI-Generated Summary

PDF342November 28, 2024