MIRIX : Système de mémoire multi-agents pour agents basés sur des modèles de langage de grande taille
MIRIX: Multi-Agent Memory System for LLM-Based Agents
July 10, 2025
papers.authors: Yu Wang, Xi Chen
cs.AI
papers.abstract
Bien que les capacités de mémoire des agents d'IA attirent une attention croissante, les solutions existantes restent fondamentalement limitées. La plupart reposent sur des composants de mémoire plats et à portée étroite, ce qui limite leur capacité à personnaliser, abstraire et rappeler de manière fiable des informations spécifiques à l'utilisateur au fil du temps. À cette fin, nous présentons MIRIX, un système de mémoire modulaire et multi-agents qui redéfinit l'avenir de la mémoire en IA en relevant le défi le plus critique du domaine : permettre aux modèles de langage de véritablement se souvenir. Contrairement aux approches précédentes, MIRIX transcende le texte pour intégrer des expériences visuelles et multimodales riches, rendant la mémoire véritablement utile dans des scénarios réels. MIRIX se compose de six types de mémoire distincts et soigneusement structurés : Mémoire de Base, Épisodique, Sémantique, Procédurale, Mémoire des Ressources et Coffre de Connaissances, associés à un cadre multi-agents qui contrôle et coordonne dynamiquement les mises à jour et les récupérations. Cette conception permet aux agents de persister, de raisonner et de récupérer avec précision des données utilisateur diversifiées et à long terme à grande échelle. Nous validons MIRIX dans deux contextes exigeants. Premièrement, sur ScreenshotVQA, un benchmark multimodal complexe comprenant près de 20 000 captures d'écran haute résolution par séquence, nécessitant une compréhension contextuelle profonde et où aucun système de mémoire existant ne peut être appliqué, MIRIX atteint une précision 35 % supérieure à la base de référence RAG tout en réduisant les besoins de stockage de 99,9 %. Deuxièmement, sur LOCOMO, un benchmark de conversation longue avec une entrée textuelle unimodale, MIRIX atteint une performance de pointe de 85,4 %, surpassant largement les bases de référence existantes. Ces résultats montrent que MIRIX établit une nouvelle norme de performance pour les agents LLM augmentés par la mémoire. Pour permettre aux utilisateurs d'expérimenter notre système de mémoire, nous fournissons une application emballée alimentée par MIRIX. Elle surveille l'écran en temps réel, construit une base de mémoire personnalisée et offre une visualisation intuitive ainsi qu'un stockage local sécurisé pour garantir la confidentialité.
English
Although memory capabilities of AI agents are gaining increasing attention,
existing solutions remain fundamentally limited. Most rely on flat, narrowly
scoped memory components, constraining their ability to personalize, abstract,
and reliably recall user-specific information over time. To this end, we
introduce MIRIX, a modular, multi-agent memory system that redefines the future
of AI memory by solving the field's most critical challenge: enabling language
models to truly remember. Unlike prior approaches, MIRIX transcends text to
embrace rich visual and multimodal experiences, making memory genuinely useful
in real-world scenarios. MIRIX consists of six distinct, carefully structured
memory types: Core, Episodic, Semantic, Procedural, Resource Memory, and
Knowledge Vault, coupled with a multi-agent framework that dynamically controls
and coordinates updates and retrieval. This design enables agents to persist,
reason over, and accurately retrieve diverse, long-term user data at scale. We
validate MIRIX in two demanding settings. First, on ScreenshotVQA, a
challenging multimodal benchmark comprising nearly 20,000 high-resolution
computer screenshots per sequence, requiring deep contextual understanding and
where no existing memory systems can be applied, MIRIX achieves 35% higher
accuracy than the RAG baseline while reducing storage requirements by 99.9%.
Second, on LOCOMO, a long-form conversation benchmark with single-modal textual
input, MIRIX attains state-of-the-art performance of 85.4%, far surpassing
existing baselines. These results show that MIRIX sets a new performance
standard for memory-augmented LLM agents. To allow users to experience our
memory system, we provide a packaged application powered by MIRIX. It monitors
the screen in real time, builds a personalized memory base, and offers
intuitive visualization and secure local storage to ensure privacy.