ChatPaper.aiChatPaper

MIRIX : Système de mémoire multi-agents pour agents basés sur des modèles de langage de grande taille

MIRIX: Multi-Agent Memory System for LLM-Based Agents

July 10, 2025
papers.authors: Yu Wang, Xi Chen
cs.AI

papers.abstract

Bien que les capacités de mémoire des agents d'IA attirent une attention croissante, les solutions existantes restent fondamentalement limitées. La plupart reposent sur des composants de mémoire plats et à portée étroite, ce qui limite leur capacité à personnaliser, abstraire et rappeler de manière fiable des informations spécifiques à l'utilisateur au fil du temps. À cette fin, nous présentons MIRIX, un système de mémoire modulaire et multi-agents qui redéfinit l'avenir de la mémoire en IA en relevant le défi le plus critique du domaine : permettre aux modèles de langage de véritablement se souvenir. Contrairement aux approches précédentes, MIRIX transcende le texte pour intégrer des expériences visuelles et multimodales riches, rendant la mémoire véritablement utile dans des scénarios réels. MIRIX se compose de six types de mémoire distincts et soigneusement structurés : Mémoire de Base, Épisodique, Sémantique, Procédurale, Mémoire des Ressources et Coffre de Connaissances, associés à un cadre multi-agents qui contrôle et coordonne dynamiquement les mises à jour et les récupérations. Cette conception permet aux agents de persister, de raisonner et de récupérer avec précision des données utilisateur diversifiées et à long terme à grande échelle. Nous validons MIRIX dans deux contextes exigeants. Premièrement, sur ScreenshotVQA, un benchmark multimodal complexe comprenant près de 20 000 captures d'écran haute résolution par séquence, nécessitant une compréhension contextuelle profonde et où aucun système de mémoire existant ne peut être appliqué, MIRIX atteint une précision 35 % supérieure à la base de référence RAG tout en réduisant les besoins de stockage de 99,9 %. Deuxièmement, sur LOCOMO, un benchmark de conversation longue avec une entrée textuelle unimodale, MIRIX atteint une performance de pointe de 85,4 %, surpassant largement les bases de référence existantes. Ces résultats montrent que MIRIX établit une nouvelle norme de performance pour les agents LLM augmentés par la mémoire. Pour permettre aux utilisateurs d'expérimenter notre système de mémoire, nous fournissons une application emballée alimentée par MIRIX. Elle surveille l'écran en temps réel, construit une base de mémoire personnalisée et offre une visualisation intuitive ainsi qu'un stockage local sécurisé pour garantir la confidentialité.
English
Although memory capabilities of AI agents are gaining increasing attention, existing solutions remain fundamentally limited. Most rely on flat, narrowly scoped memory components, constraining their ability to personalize, abstract, and reliably recall user-specific information over time. To this end, we introduce MIRIX, a modular, multi-agent memory system that redefines the future of AI memory by solving the field's most critical challenge: enabling language models to truly remember. Unlike prior approaches, MIRIX transcends text to embrace rich visual and multimodal experiences, making memory genuinely useful in real-world scenarios. MIRIX consists of six distinct, carefully structured memory types: Core, Episodic, Semantic, Procedural, Resource Memory, and Knowledge Vault, coupled with a multi-agent framework that dynamically controls and coordinates updates and retrieval. This design enables agents to persist, reason over, and accurately retrieve diverse, long-term user data at scale. We validate MIRIX in two demanding settings. First, on ScreenshotVQA, a challenging multimodal benchmark comprising nearly 20,000 high-resolution computer screenshots per sequence, requiring deep contextual understanding and where no existing memory systems can be applied, MIRIX achieves 35% higher accuracy than the RAG baseline while reducing storage requirements by 99.9%. Second, on LOCOMO, a long-form conversation benchmark with single-modal textual input, MIRIX attains state-of-the-art performance of 85.4%, far surpassing existing baselines. These results show that MIRIX sets a new performance standard for memory-augmented LLM agents. To allow users to experience our memory system, we provide a packaged application powered by MIRIX. It monitors the screen in real time, builds a personalized memory base, and offers intuitive visualization and secure local storage to ensure privacy.
PDF481July 11, 2025