MIRIX: Multi-Agent Geheugensysteem voor LLM-Gebaseerde Agents
MIRIX: Multi-Agent Memory System for LLM-Based Agents
July 10, 2025
Auteurs: Yu Wang, Xi Chen
cs.AI
Samenvatting
Hoewel de geheugencapaciteiten van AI-agents steeds meer aandacht krijgen, blijven bestaande oplossingen fundamenteel beperkt. De meeste vertrouwen op platte, smal gedefinieerde geheugencomponenten, wat hun vermogen beperkt om te personaliseren, te abstraheren en gebruikersspecifieke informatie betrouwbaar te onthouden over tijd. Daarom introduceren we MIRIX, een modulair, multi-agent geheugensysteem dat de toekomst van AI-geheugen herdefinieert door het meest kritieke probleem van het veld op te lossen: het mogelijk maken voor taalmodellen om echt te onthouden. In tegenstelling tot eerdere benaderingen, gaat MIRIX verder dan tekst en omarmt het rijke visuele en multimodale ervaringen, waardoor geheugen echt nuttig wordt in realistische scenario's. MIRIX bestaat uit zes verschillende, zorgvuldig gestructureerde geheugentypes: Core, Episodisch, Semantisch, Procedureel, Resource Memory en Knowledge Vault, gekoppeld aan een multi-agent framework dat updates en retrievals dynamisch controleert en coördineert. Dit ontwerp stelt agents in staat om diverse, langetermijn gebruikersdata op grote schaal te behouden, over te redeneren en nauwkeurig op te halen. We valideren MIRIX in twee veeleisende omgevingen. Ten eerste, op ScreenshotVQA, een uitdagende multimodale benchmark bestaande uit bijna 20.000 hoge-resolutie computerschermafbeeldingen per reeks, die een diep contextueel begrip vereist en waar geen bestaande geheugensystemen kunnen worden toegepast, behaalt MIRIX 35% hogere nauwkeurigheid dan de RAG-baseline terwijl de opslagvereisten met 99,9% worden verminderd. Ten tweede, op LOCOMO, een langdurige conversatiebenchmark met enkelvoudige modale tekstuele input, bereikt MIRIX state-of-the-art prestaties van 85,4%, wat ver boven de bestaande baselines uitstijgt. Deze resultaten tonen aan dat MIRIX een nieuwe prestatiestandaard zet voor geheugen-augmented LLM-agents. Om gebruikers onze geheugensysteem te laten ervaren, bieden we een verpakte applicatie aan, aangedreven door MIRIX. Het monitort het scherm in realtime, bouwt een gepersonaliseerde geheugenbasis op en biedt intuïtieve visualisatie en veilige lokale opslag om privacy te waarborgen.
English
Although memory capabilities of AI agents are gaining increasing attention,
existing solutions remain fundamentally limited. Most rely on flat, narrowly
scoped memory components, constraining their ability to personalize, abstract,
and reliably recall user-specific information over time. To this end, we
introduce MIRIX, a modular, multi-agent memory system that redefines the future
of AI memory by solving the field's most critical challenge: enabling language
models to truly remember. Unlike prior approaches, MIRIX transcends text to
embrace rich visual and multimodal experiences, making memory genuinely useful
in real-world scenarios. MIRIX consists of six distinct, carefully structured
memory types: Core, Episodic, Semantic, Procedural, Resource Memory, and
Knowledge Vault, coupled with a multi-agent framework that dynamically controls
and coordinates updates and retrieval. This design enables agents to persist,
reason over, and accurately retrieve diverse, long-term user data at scale. We
validate MIRIX in two demanding settings. First, on ScreenshotVQA, a
challenging multimodal benchmark comprising nearly 20,000 high-resolution
computer screenshots per sequence, requiring deep contextual understanding and
where no existing memory systems can be applied, MIRIX achieves 35% higher
accuracy than the RAG baseline while reducing storage requirements by 99.9%.
Second, on LOCOMO, a long-form conversation benchmark with single-modal textual
input, MIRIX attains state-of-the-art performance of 85.4%, far surpassing
existing baselines. These results show that MIRIX sets a new performance
standard for memory-augmented LLM agents. To allow users to experience our
memory system, we provide a packaged application powered by MIRIX. It monitors
the screen in real time, builds a personalized memory base, and offers
intuitive visualization and secure local storage to ensure privacy.