ChatPaper.aiChatPaper

MIRIX: LLM 기반 에이전트를 위한 다중 에이전트 메모리 시스템

MIRIX: Multi-Agent Memory System for LLM-Based Agents

July 10, 2025
저자: Yu Wang, Xi Chen
cs.AI

초록

AI 에이전트의 메모리 능력이 점점 더 주목받고 있지만, 기존 솔루션은 근본적으로 한계를 지니고 있다. 대부분의 솔루션은 단순하고 좁은 범위의 메모리 구성 요소에 의존하여, 시간이 지남에 따라 사용자별 정보를 개인화하고 추상화하며 신뢰할 수 있게 회상하는 능력이 제한된다. 이를 해결하기 위해, 우리는 MIRIX를 소개한다. MIRIX는 모듈식 다중 에이전트 메모리 시스템으로, 언어 모델이 진정으로 기억할 수 있도록 하는 이 분야의 가장 중요한 과제를 해결함으로써 AI 메모리의 미래를 재정의한다. 기존 접근 방식과 달리, MIRIX는 텍스트를 넘어 풍부한 시각적 및 다중 모달 경험을 포용하여, 메모리가 실제 시나리오에서 진정으로 유용하게 만든다. MIRIX는 Core, Episodic, Semantic, Procedural, Resource Memory, Knowledge Vault라는 여섯 가지의 구별되고 신중하게 구조화된 메모리 유형으로 구성되며, 업데이트와 검색을 동적으로 제어하고 조정하는 다중 에이전트 프레임워크와 결합된다. 이 설계는 에이전트가 다양한 장기 사용자 데이터를 대규모로 지속하고, 추론하며, 정확하게 검색할 수 있게 한다. 우리는 MIRIX를 두 가지 까다로운 환경에서 검증했다. 첫째, ScreenshotVQA에서 MIRIX는 깊은 맥락적 이해를 요구하고 기존 메모리 시스템을 적용할 수 없는, 시퀀스당 거의 20,000개의 고해상도 컴퓨터 스크린샷으로 구성된 도전적인 다중 모달 벤치마크에서 RAG 기준선보다 35% 더 높은 정확도를 달성하면서 저장 요구량을 99.9% 줄였다. 둘째, LOCOMO에서 MIRIX는 단일 모달 텍스트 입력을 사용한 장문 대화 벤치마크에서 85.4%의 최첨단 성능을 달성하여 기존 기준선을 훨씬 능가했다. 이러한 결과는 MIRIX가 메모리 강화 LLM 에이전트에 대한 새로운 성능 기준을 설정함을 보여준다. 사용자가 우리의 메모리 시스템을 경험할 수 있도록, 우리는 MIRIX로 구동되는 패키지 애플리케이션을 제공한다. 이 애플리케이션은 실시간으로 화면을 모니터링하고, 개인화된 메모리 베이스를 구축하며, 직관적인 시각화와 안전한 로컬 저장소를 제공하여 프라이버시를 보장한다.
English
Although memory capabilities of AI agents are gaining increasing attention, existing solutions remain fundamentally limited. Most rely on flat, narrowly scoped memory components, constraining their ability to personalize, abstract, and reliably recall user-specific information over time. To this end, we introduce MIRIX, a modular, multi-agent memory system that redefines the future of AI memory by solving the field's most critical challenge: enabling language models to truly remember. Unlike prior approaches, MIRIX transcends text to embrace rich visual and multimodal experiences, making memory genuinely useful in real-world scenarios. MIRIX consists of six distinct, carefully structured memory types: Core, Episodic, Semantic, Procedural, Resource Memory, and Knowledge Vault, coupled with a multi-agent framework that dynamically controls and coordinates updates and retrieval. This design enables agents to persist, reason over, and accurately retrieve diverse, long-term user data at scale. We validate MIRIX in two demanding settings. First, on ScreenshotVQA, a challenging multimodal benchmark comprising nearly 20,000 high-resolution computer screenshots per sequence, requiring deep contextual understanding and where no existing memory systems can be applied, MIRIX achieves 35% higher accuracy than the RAG baseline while reducing storage requirements by 99.9%. Second, on LOCOMO, a long-form conversation benchmark with single-modal textual input, MIRIX attains state-of-the-art performance of 85.4%, far surpassing existing baselines. These results show that MIRIX sets a new performance standard for memory-augmented LLM agents. To allow users to experience our memory system, we provide a packaged application powered by MIRIX. It monitors the screen in real time, builds a personalized memory base, and offers intuitive visualization and secure local storage to ensure privacy.
PDF481July 11, 2025