ChatPaper.aiChatPaper

MIRIX: Sistema de Memória Multiagente para Agentes Baseados em LLM

MIRIX: Multi-Agent Memory System for LLM-Based Agents

July 10, 2025
Autores: Yu Wang, Xi Chen
cs.AI

Resumo

Embora as capacidades de memória dos agentes de IA estejam recebendo atenção crescente, as soluções existentes permanecem fundamentalmente limitadas. A maioria depende de componentes de memória planos e de escopo restrito, o que restringe sua capacidade de personalizar, abstrair e recuperar de forma confiável informações específicas do usuário ao longo do tempo. Para isso, apresentamos o MIRIX, um sistema de memória modular e multiagente que redefine o futuro da memória de IA ao resolver o desafio mais crítico do campo: permitir que os modelos de linguagem realmente se lembrem. Diferente das abordagens anteriores, o MIRIX transcende o texto para abraçar experiências visuais e multimodais ricas, tornando a memória genuinamente útil em cenários do mundo real. O MIRIX consiste em seis tipos de memória distintos e cuidadosamente estruturados: Memória Central, Episódica, Semântica, Procedimental, de Recursos e o Cofre de Conhecimento, acoplados a um framework multiagente que controla e coordena dinamicamente atualizações e recuperações. Esse design permite que os agentes persistam, raciocinem e recuperem com precisão dados diversos e de longo prazo do usuário em escala. Validamos o MIRIX em dois cenários exigentes. Primeiro, no ScreenshotVQA, um benchmark multimodal desafiador composto por quase 20.000 capturas de tela de alta resolução por sequência, que requer um profundo entendimento contextual e onde nenhum sistema de memória existente pode ser aplicado, o MIRIX alcança uma precisão 35% maior que a linha de base RAG, enquanto reduz os requisitos de armazenamento em 99,9%. Segundo, no LOCOMO, um benchmark de conversação de longa duração com entrada textual unimodal, o MIRIX atinge um desempenho de ponta de 85,4%, superando amplamente as linhas de base existentes. Esses resultados mostram que o MIRIX estabelece um novo padrão de desempenho para agentes de LLM aumentados por memória. Para permitir que os usuários experimentem nosso sistema de memória, fornecemos um aplicativo empacotado alimentado pelo MIRIX. Ele monitora a tela em tempo real, constrói uma base de memória personalizada e oferece visualização intuitiva e armazenamento local seguro para garantir a privacidade.
English
Although memory capabilities of AI agents are gaining increasing attention, existing solutions remain fundamentally limited. Most rely on flat, narrowly scoped memory components, constraining their ability to personalize, abstract, and reliably recall user-specific information over time. To this end, we introduce MIRIX, a modular, multi-agent memory system that redefines the future of AI memory by solving the field's most critical challenge: enabling language models to truly remember. Unlike prior approaches, MIRIX transcends text to embrace rich visual and multimodal experiences, making memory genuinely useful in real-world scenarios. MIRIX consists of six distinct, carefully structured memory types: Core, Episodic, Semantic, Procedural, Resource Memory, and Knowledge Vault, coupled with a multi-agent framework that dynamically controls and coordinates updates and retrieval. This design enables agents to persist, reason over, and accurately retrieve diverse, long-term user data at scale. We validate MIRIX in two demanding settings. First, on ScreenshotVQA, a challenging multimodal benchmark comprising nearly 20,000 high-resolution computer screenshots per sequence, requiring deep contextual understanding and where no existing memory systems can be applied, MIRIX achieves 35% higher accuracy than the RAG baseline while reducing storage requirements by 99.9%. Second, on LOCOMO, a long-form conversation benchmark with single-modal textual input, MIRIX attains state-of-the-art performance of 85.4%, far surpassing existing baselines. These results show that MIRIX sets a new performance standard for memory-augmented LLM agents. To allow users to experience our memory system, we provide a packaged application powered by MIRIX. It monitors the screen in real time, builds a personalized memory base, and offers intuitive visualization and secure local storage to ensure privacy.
PDF551July 11, 2025