MIRIX: Sistema de Memória Multiagente para Agentes Baseados em LLM
MIRIX: Multi-Agent Memory System for LLM-Based Agents
July 10, 2025
Autores: Yu Wang, Xi Chen
cs.AI
Resumo
Embora as capacidades de memória dos agentes de IA estejam recebendo atenção crescente, as soluções existentes permanecem fundamentalmente limitadas. A maioria depende de componentes de memória planos e de escopo restrito, o que restringe sua capacidade de personalizar, abstrair e recuperar de forma confiável informações específicas do usuário ao longo do tempo. Para isso, apresentamos o MIRIX, um sistema de memória modular e multiagente que redefine o futuro da memória de IA ao resolver o desafio mais crítico do campo: permitir que os modelos de linguagem realmente se lembrem. Diferente das abordagens anteriores, o MIRIX transcende o texto para abraçar experiências visuais e multimodais ricas, tornando a memória genuinamente útil em cenários do mundo real. O MIRIX consiste em seis tipos de memória distintos e cuidadosamente estruturados: Memória Central, Episódica, Semântica, Procedimental, de Recursos e o Cofre de Conhecimento, acoplados a um framework multiagente que controla e coordena dinamicamente atualizações e recuperações. Esse design permite que os agentes persistam, raciocinem e recuperem com precisão dados diversos e de longo prazo do usuário em escala. Validamos o MIRIX em dois cenários exigentes. Primeiro, no ScreenshotVQA, um benchmark multimodal desafiador composto por quase 20.000 capturas de tela de alta resolução por sequência, que requer um profundo entendimento contextual e onde nenhum sistema de memória existente pode ser aplicado, o MIRIX alcança uma precisão 35% maior que a linha de base RAG, enquanto reduz os requisitos de armazenamento em 99,9%. Segundo, no LOCOMO, um benchmark de conversação de longa duração com entrada textual unimodal, o MIRIX atinge um desempenho de ponta de 85,4%, superando amplamente as linhas de base existentes. Esses resultados mostram que o MIRIX estabelece um novo padrão de desempenho para agentes de LLM aumentados por memória. Para permitir que os usuários experimentem nosso sistema de memória, fornecemos um aplicativo empacotado alimentado pelo MIRIX. Ele monitora a tela em tempo real, constrói uma base de memória personalizada e oferece visualização intuitiva e armazenamento local seguro para garantir a privacidade.
English
Although memory capabilities of AI agents are gaining increasing attention,
existing solutions remain fundamentally limited. Most rely on flat, narrowly
scoped memory components, constraining their ability to personalize, abstract,
and reliably recall user-specific information over time. To this end, we
introduce MIRIX, a modular, multi-agent memory system that redefines the future
of AI memory by solving the field's most critical challenge: enabling language
models to truly remember. Unlike prior approaches, MIRIX transcends text to
embrace rich visual and multimodal experiences, making memory genuinely useful
in real-world scenarios. MIRIX consists of six distinct, carefully structured
memory types: Core, Episodic, Semantic, Procedural, Resource Memory, and
Knowledge Vault, coupled with a multi-agent framework that dynamically controls
and coordinates updates and retrieval. This design enables agents to persist,
reason over, and accurately retrieve diverse, long-term user data at scale. We
validate MIRIX in two demanding settings. First, on ScreenshotVQA, a
challenging multimodal benchmark comprising nearly 20,000 high-resolution
computer screenshots per sequence, requiring deep contextual understanding and
where no existing memory systems can be applied, MIRIX achieves 35% higher
accuracy than the RAG baseline while reducing storage requirements by 99.9%.
Second, on LOCOMO, a long-form conversation benchmark with single-modal textual
input, MIRIX attains state-of-the-art performance of 85.4%, far surpassing
existing baselines. These results show that MIRIX sets a new performance
standard for memory-augmented LLM agents. To allow users to experience our
memory system, we provide a packaged application powered by MIRIX. It monitors
the screen in real time, builds a personalized memory base, and offers
intuitive visualization and secure local storage to ensure privacy.