ChatPaper.aiChatPaper

MIRIX: Multi-Agenten-Gedächtnissystem für LLM-basierte Agenten

MIRIX: Multi-Agent Memory System for LLM-Based Agents

July 10, 2025
papers.authors: Yu Wang, Xi Chen
cs.AI

papers.abstract

Obwohl die Gedächtnisfähigkeiten von KI-Agenten zunehmend Aufmerksamkeit erhalten, bleiben bestehende Lösungen grundlegend begrenzt. Die meisten stützen sich auf flache, eng begrenzte Gedächtniskomponenten, was ihre Fähigkeit einschränkt, personalisierte, abstrakte und zuverlässige Erinnerungen an benutzerspezifische Informationen über die Zeit hinweg zu ermöglichen. Aus diesem Grund stellen wir MIRIX vor, ein modulares, multi-agenten-basiertes Gedächtnissystem, das die Zukunft des KI-Gedächtnisses neu definiert, indem es die größte Herausforderung des Feldes löst: Sprachmodelle dazu zu befähigen, sich wirklich zu erinnern. Im Gegensatz zu früheren Ansätzen geht MIRIX über Text hinaus und umfasst reichhaltige visuelle und multimodale Erfahrungen, wodurch das Gedächtnis in realen Szenarien tatsächlich nützlich wird. MIRIX besteht aus sechs verschiedenen, sorgfältig strukturierten Gedächtnistypen: Kern-, Episodisches-, Semantisches-, Prozedurales-, Ressourcen-Gedächtnis und Wissensspeicher, gekoppelt mit einem Multi-Agenten-Framework, das Aktualisierungen und Abrufe dynamisch steuert und koordiniert. Dieser Entwurf ermöglicht es Agenten, vielfältige, langfristige Benutzerdaten in großem Maßstab zu speichern, darüber zu schlussfolgern und präzise abzurufen. Wir validieren MIRIX in zwei anspruchsvollen Umgebungen. Erstens auf ScreenshotVQA, einem herausfordernden multimodalen Benchmark, der fast 20.000 hochauflösende Computerbildschirmfotos pro Sequenz umfasst und ein tiefes kontextuelles Verständnis erfordert, wo keine bestehenden Gedächtnissysteme angewendet werden können, erreicht MIRIX eine 35 % höhere Genauigkeit als die RAG-Baseline, während die Speicheranforderungen um 99,9 % reduziert werden. Zweitens auf LOCOMO, einem Benchmark für lange Gespräche mit einmodaler Texteingabe, erreicht MIRIX eine state-of-the-art Leistung von 85,4 %, was die bestehenden Baselines deutlich übertrifft. Diese Ergebnisse zeigen, dass MIRIX einen neuen Leistungsstandard für gedächtnisgestützte LLM-Agenten setzt. Um Benutzern die Möglichkeit zu geben, unser Gedächtnissystem zu erleben, bieten wir eine verpackte Anwendung, die von MIRIX angetrieben wird. Sie überwacht den Bildschirm in Echtzeit, baut eine personalisierte Gedächtnisbasis auf und bietet intuitive Visualisierung und sichere lokale Speicherung, um die Privatsphäre zu gewährleisten.
English
Although memory capabilities of AI agents are gaining increasing attention, existing solutions remain fundamentally limited. Most rely on flat, narrowly scoped memory components, constraining their ability to personalize, abstract, and reliably recall user-specific information over time. To this end, we introduce MIRIX, a modular, multi-agent memory system that redefines the future of AI memory by solving the field's most critical challenge: enabling language models to truly remember. Unlike prior approaches, MIRIX transcends text to embrace rich visual and multimodal experiences, making memory genuinely useful in real-world scenarios. MIRIX consists of six distinct, carefully structured memory types: Core, Episodic, Semantic, Procedural, Resource Memory, and Knowledge Vault, coupled with a multi-agent framework that dynamically controls and coordinates updates and retrieval. This design enables agents to persist, reason over, and accurately retrieve diverse, long-term user data at scale. We validate MIRIX in two demanding settings. First, on ScreenshotVQA, a challenging multimodal benchmark comprising nearly 20,000 high-resolution computer screenshots per sequence, requiring deep contextual understanding and where no existing memory systems can be applied, MIRIX achieves 35% higher accuracy than the RAG baseline while reducing storage requirements by 99.9%. Second, on LOCOMO, a long-form conversation benchmark with single-modal textual input, MIRIX attains state-of-the-art performance of 85.4%, far surpassing existing baselines. These results show that MIRIX sets a new performance standard for memory-augmented LLM agents. To allow users to experience our memory system, we provide a packaged application powered by MIRIX. It monitors the screen in real time, builds a personalized memory base, and offers intuitive visualization and secure local storage to ensure privacy.
PDF481July 11, 2025