ChatPaper.aiChatPaper

MIRIX: Multi-Agent Geheugensysteem voor LLM-Gebaseerde Agents

MIRIX: Multi-Agent Memory System for LLM-Based Agents

July 10, 2025
Auteurs: Yu Wang, Xi Chen
cs.AI

Samenvatting

Hoewel de geheugencapaciteiten van AI-agents steeds meer aandacht krijgen, blijven bestaande oplossingen fundamenteel beperkt. De meeste vertrouwen op platte, smal gedefinieerde geheugencomponenten, wat hun vermogen beperkt om te personaliseren, te abstraheren en gebruikersspecifieke informatie betrouwbaar te onthouden over tijd. Daarom introduceren we MIRIX, een modulair, multi-agent geheugensysteem dat de toekomst van AI-geheugen herdefinieert door het meest kritieke probleem van het veld op te lossen: het mogelijk maken voor taalmodellen om echt te onthouden. In tegenstelling tot eerdere benaderingen, gaat MIRIX verder dan tekst en omarmt het rijke visuele en multimodale ervaringen, waardoor geheugen echt nuttig wordt in realistische scenario's. MIRIX bestaat uit zes verschillende, zorgvuldig gestructureerde geheugentypes: Core, Episodisch, Semantisch, Procedureel, Resource Memory en Knowledge Vault, gekoppeld aan een multi-agent framework dat updates en retrievals dynamisch controleert en coördineert. Dit ontwerp stelt agents in staat om diverse, langetermijn gebruikersdata op grote schaal te behouden, over te redeneren en nauwkeurig op te halen. We valideren MIRIX in twee veeleisende omgevingen. Ten eerste, op ScreenshotVQA, een uitdagende multimodale benchmark bestaande uit bijna 20.000 hoge-resolutie computerschermafbeeldingen per reeks, die een diep contextueel begrip vereist en waar geen bestaande geheugensystemen kunnen worden toegepast, behaalt MIRIX 35% hogere nauwkeurigheid dan de RAG-baseline terwijl de opslagvereisten met 99,9% worden verminderd. Ten tweede, op LOCOMO, een langdurige conversatiebenchmark met enkelvoudige modale tekstuele input, bereikt MIRIX state-of-the-art prestaties van 85,4%, wat ver boven de bestaande baselines uitstijgt. Deze resultaten tonen aan dat MIRIX een nieuwe prestatiestandaard zet voor geheugen-augmented LLM-agents. Om gebruikers onze geheugensysteem te laten ervaren, bieden we een verpakte applicatie aan, aangedreven door MIRIX. Het monitort het scherm in realtime, bouwt een gepersonaliseerde geheugenbasis op en biedt intuïtieve visualisatie en veilige lokale opslag om privacy te waarborgen.
English
Although memory capabilities of AI agents are gaining increasing attention, existing solutions remain fundamentally limited. Most rely on flat, narrowly scoped memory components, constraining their ability to personalize, abstract, and reliably recall user-specific information over time. To this end, we introduce MIRIX, a modular, multi-agent memory system that redefines the future of AI memory by solving the field's most critical challenge: enabling language models to truly remember. Unlike prior approaches, MIRIX transcends text to embrace rich visual and multimodal experiences, making memory genuinely useful in real-world scenarios. MIRIX consists of six distinct, carefully structured memory types: Core, Episodic, Semantic, Procedural, Resource Memory, and Knowledge Vault, coupled with a multi-agent framework that dynamically controls and coordinates updates and retrieval. This design enables agents to persist, reason over, and accurately retrieve diverse, long-term user data at scale. We validate MIRIX in two demanding settings. First, on ScreenshotVQA, a challenging multimodal benchmark comprising nearly 20,000 high-resolution computer screenshots per sequence, requiring deep contextual understanding and where no existing memory systems can be applied, MIRIX achieves 35% higher accuracy than the RAG baseline while reducing storage requirements by 99.9%. Second, on LOCOMO, a long-form conversation benchmark with single-modal textual input, MIRIX attains state-of-the-art performance of 85.4%, far surpassing existing baselines. These results show that MIRIX sets a new performance standard for memory-augmented LLM agents. To allow users to experience our memory system, we provide a packaged application powered by MIRIX. It monitors the screen in real time, builds a personalized memory base, and offers intuitive visualization and secure local storage to ensure privacy.
PDF731July 11, 2025