MIRIX: Sistema di Memoria Multi-Agente per Agenti Basati su LLM
MIRIX: Multi-Agent Memory System for LLM-Based Agents
July 10, 2025
Autori: Yu Wang, Xi Chen
cs.AI
Abstract
Sebbene le capacità di memoria degli agenti di IA stiano attirando un'attenzione crescente, le soluzioni esistenti rimangono fondamentalmente limitate. La maggior parte si affida a componenti di memoria piatti e con un ambito ristretto, limitando la loro capacità di personalizzare, astrarre e richiamare in modo affidabile informazioni specifiche dell'utente nel tempo. A tal fine, introduciamo MIRIX, un sistema di memoria modulare e multi-agente che ridefinisce il futuro della memoria dell'IA risolvendo la sfida più critica del settore: consentire ai modelli linguistici di ricordare veramente. A differenza degli approcci precedenti, MIRIX trascende il testo per abbracciare esperienze visive e multimodali ricche, rendendo la memoria genuinamente utile in scenari reali. MIRIX è composto da sei tipi di memoria distinti e accuratamente strutturati: Core, Episodica, Semantica, Procedurale, Memoria delle Risorse e Knowledge Vault, abbinati a un framework multi-agente che controlla e coordina dinamicamente aggiornamenti e recupero. Questo design consente agli agenti di persistere, ragionare e recuperare con precisione dati utente diversificati e a lungo termine su larga scala. Validiamo MIRIX in due contesti impegnativi. Innanzitutto, su ScreenshotVQA, un benchmark multimodale complesso che comprende quasi 20.000 screenshot di computer ad alta risoluzione per sequenza, che richiede una profonda comprensione contestuale e dove nessun sistema di memoria esistente può essere applicato, MIRIX raggiunge un'accuratezza del 35% superiore rispetto alla baseline RAG riducendo i requisiti di archiviazione del 99,9%. In secondo luogo, su LOCOMO, un benchmark di conversazione a lungo termine con input testuale a modalità singola, MIRIX raggiunge una performance all'avanguardia dell'85,4%, superando di gran lunga le baseline esistenti. Questi risultati dimostrano che MIRIX stabilisce un nuovo standard di prestazione per gli agenti LLM potenziati dalla memoria. Per consentire agli utenti di sperimentare il nostro sistema di memoria, forniamo un'applicazione confezionata alimentata da MIRIX. Monitora lo schermo in tempo reale, costruisce una base di memoria personalizzata e offre una visualizzazione intuitiva e un archivio locale sicuro per garantire la privacy.
English
Although memory capabilities of AI agents are gaining increasing attention,
existing solutions remain fundamentally limited. Most rely on flat, narrowly
scoped memory components, constraining their ability to personalize, abstract,
and reliably recall user-specific information over time. To this end, we
introduce MIRIX, a modular, multi-agent memory system that redefines the future
of AI memory by solving the field's most critical challenge: enabling language
models to truly remember. Unlike prior approaches, MIRIX transcends text to
embrace rich visual and multimodal experiences, making memory genuinely useful
in real-world scenarios. MIRIX consists of six distinct, carefully structured
memory types: Core, Episodic, Semantic, Procedural, Resource Memory, and
Knowledge Vault, coupled with a multi-agent framework that dynamically controls
and coordinates updates and retrieval. This design enables agents to persist,
reason over, and accurately retrieve diverse, long-term user data at scale. We
validate MIRIX in two demanding settings. First, on ScreenshotVQA, a
challenging multimodal benchmark comprising nearly 20,000 high-resolution
computer screenshots per sequence, requiring deep contextual understanding and
where no existing memory systems can be applied, MIRIX achieves 35% higher
accuracy than the RAG baseline while reducing storage requirements by 99.9%.
Second, on LOCOMO, a long-form conversation benchmark with single-modal textual
input, MIRIX attains state-of-the-art performance of 85.4%, far surpassing
existing baselines. These results show that MIRIX sets a new performance
standard for memory-augmented LLM agents. To allow users to experience our
memory system, we provide a packaged application powered by MIRIX. It monitors
the screen in real time, builds a personalized memory base, and offers
intuitive visualization and secure local storage to ensure privacy.