ChatPaper.aiChatPaper

Memanto: 장기적 목표를 가진 에이전트를 위한 정보 이론적 검색 기반 유형 의미 메모리

Memanto: Typed Semantic Memory with Information-Theoretic Retrieval for Long-Horizon Agents

April 23, 2026
저자: Seyed Moein Abtahi, Rasa Rahnema, Hetkumar Patel, Neel Patel, Majid Fekri, Tara Khani
cs.AI

초록

무상태 언어 모델 추론에서 지속적 다중 세션 자율 에이전트로의 전환은 프로덕션 등급 에이전트 시스템 배포에 있어 메모리가 주요 아키텍처적 병목 현상으로 부상했음을 보여주었습니다. 기존 방법론은 주로 하이브리드 의미론적 그래프 아키텍처에 의존하며, 이는 정보 수집 및 검색 과정 모두에서 상당한 컴퓨팅 오버헤드를 초래합니다. 이러한 시스템들은 일반적으로 대규모 언어 모델을 매개로 한 개체 추출, 명시적 그래프 스키마 유지 관리, 그리고 다중 질의 검색 파이프라인을 필요로 합니다. 본 논문은 지식 그래프의 복잡성이 높은 정밀도의 에이전트 메모리를 구현하기 위해 필수적이라는 기존 가정에 도전하는 범용 에이전트 인공지능 메모리 계층인 Memanto를 소개합니다. Memanto는 13개의 사전 정의된 메모리 범주로 구성된 유형 기반 의미론적 메모리 스키마, 자동화된 충돌 해결 메커니즘, 그리고 시간적 버전 관리를 통합합니다. 이러한 구성 요소들은 인덱싱이 없는 의미론적 데이터베이스인 Moorcheh 정보 이론 검색 엔진을 통해 구현되며, 이 엔진은 90밀리초 미만의 지연 시간 내에서 결정론적 검색을 제공함과 동시에 정보 수집 지연을 제거합니다. LongMemEval 및 LoCoMo 평가 모음에 대한 체계적인 벤치마킹을 통해 Memanto는 각각 89.8%, 87.1%의 최첨단 정확도 점수를 달성했습니다. 이러한 결과는 단일 검색 질의만 필요로 하고 정보 수집 비용이 전혀 들지 않으며 훨씬 낮은 운영 복잡성을 유지하면서, 평가된 모든 하이브리드 그래프 및 벡터 기반 시스템을 능가합니다. 각 아키텍처 구성 요소의 기여도를 정량화하기 위한 5단계 점진적 애블레이션 연구가 제시되며, 이어서 확장 가능한 에이전트 메모리 시스템 배포의 함의에 대한 논의가 이어집니다.
English
The transition from stateless language model inference to persistent, multi session autonomous agents has revealed memory to be a primary architectural bottleneck in the deployment of production grade agentic systems. Existing methodologies largely depend on hybrid semantic graph architectures, which impose substantial computational overhead during both ingestion and retrieval. These systems typically require large language model mediated entity extraction, explicit graph schema maintenance, and multi query retrieval pipelines. This paper introduces Memanto, a universal memory layer for agentic artificial intelligence that challenges the prevailing assumption that knowledge graph complexity is necessary to achieve high fidelity agent memory. Memanto integrates a typed semantic memory schema comprising thirteen predefined memory categories, an automated conflict resolution mechanism, and temporal versioning. These components are enabled by Moorcheh's Information Theoretic Search engine, a no indexing semantic database that provides deterministic retrieval within sub ninety millisecond latency while eliminating ingestion delay. Through systematic benchmarking on the LongMemEval and LoCoMo evaluation suites, Memanto achieves state of the art accuracy scores of 89.8 percent and 87.1 percent respectively. These results surpass all evaluated hybrid graph and vector based systems while requiring only a single retrieval query, incurring no ingestion cost, and maintaining substantially lower operational complexity. A five stage progressive ablation study is presented to quantify the contribution of each architectural component, followed by a discussion of the implications for scalable deployment of agentic memory systems.
PDF63April 28, 2026