ChatPaper.aiChatPaper

MIRIX: Многоагентная система памяти для агентов на основе LLM

MIRIX: Multi-Agent Memory System for LLM-Based Agents

July 10, 2025
Авторы: Yu Wang, Xi Chen
cs.AI

Аннотация

Хотя возможности памяти агентов искусственного интеллекта привлекают всё больше внимания, существующие решения остаются принципиально ограниченными. Большинство из них полагаются на плоские, узконаправленные компоненты памяти, что ограничивает их способность персонализировать, абстрагировать и надёжно воспроизводить пользовательскую информацию с течением времени. В связи с этим мы представляем MIRIX — модульную, многоагентную систему памяти, которая переопределяет будущее памяти ИИ, решая наиболее критическую задачу этой области: предоставление языковым моделям возможности действительно запоминать. В отличие от предыдущих подходов, MIRIX выходит за рамки текста, охватывая богатые визуальные и мультимодальные впечатления, делая память по-настоящему полезной в реальных сценариях. MIRIX состоит из шести различных, тщательно структурированных типов памяти: базовой, эпизодической, семантической, процедурной, ресурсной памяти и хранилища знаний, объединённых с многоагентной структурой, которая динамически управляет и координирует обновления и извлечение данных. Такая конструкция позволяет агентам сохранять, анализировать и точно извлекать разнообразные долгосрочные пользовательские данные в масштабе. Мы проверяем MIRIX в двух сложных условиях. Во-первых, на ScreenshotVQA — сложном мультимодальном тесте, включающем почти 20 000 высококачественных скриншотов компьютера на последовательность, требующем глубокого контекстного понимания и где ни одна из существующих систем памяти не может быть применена, MIRIX достигает на 35% большей точности, чем базовый RAG, при этом сокращая требования к хранению на 99,9%. Во-вторых, на LOCOMO — тесте длинных диалогов с одноканальным текстовым вводом, MIRIX демонстрирует передовую производительность в 85,4%, значительно превосходя существующие базовые решения. Эти результаты показывают, что MIRIX устанавливает новый стандарт производительности для агентов LLM, усиленных памятью. Чтобы пользователи могли испытать нашу систему памяти, мы предоставляем упакованное приложение, работающее на основе MIRIX. Оно отслеживает экран в реальном времени, создаёт персонализированную базу памяти и предлагает интуитивную визуализацию и безопасное локальное хранение для обеспечения конфиденциальности.
English
Although memory capabilities of AI agents are gaining increasing attention, existing solutions remain fundamentally limited. Most rely on flat, narrowly scoped memory components, constraining their ability to personalize, abstract, and reliably recall user-specific information over time. To this end, we introduce MIRIX, a modular, multi-agent memory system that redefines the future of AI memory by solving the field's most critical challenge: enabling language models to truly remember. Unlike prior approaches, MIRIX transcends text to embrace rich visual and multimodal experiences, making memory genuinely useful in real-world scenarios. MIRIX consists of six distinct, carefully structured memory types: Core, Episodic, Semantic, Procedural, Resource Memory, and Knowledge Vault, coupled with a multi-agent framework that dynamically controls and coordinates updates and retrieval. This design enables agents to persist, reason over, and accurately retrieve diverse, long-term user data at scale. We validate MIRIX in two demanding settings. First, on ScreenshotVQA, a challenging multimodal benchmark comprising nearly 20,000 high-resolution computer screenshots per sequence, requiring deep contextual understanding and where no existing memory systems can be applied, MIRIX achieves 35% higher accuracy than the RAG baseline while reducing storage requirements by 99.9%. Second, on LOCOMO, a long-form conversation benchmark with single-modal textual input, MIRIX attains state-of-the-art performance of 85.4%, far surpassing existing baselines. These results show that MIRIX sets a new performance standard for memory-augmented LLM agents. To allow users to experience our memory system, we provide a packaged application powered by MIRIX. It monitors the screen in real time, builds a personalized memory base, and offers intuitive visualization and secure local storage to ensure privacy.
PDF481July 11, 2025