Memanto: 長期的エージェントのための情報理論的検索を備えた型付きセマンティックメモリ
Memanto: Typed Semantic Memory with Information-Theoretic Retrieval for Long-Horizon Agents
April 23, 2026
著者: Seyed Moein Abtahi, Rasa Rahnema, Hetkumar Patel, Neel Patel, Majid Fekri, Tara Khani
cs.AI
要旨
ステートレスな言語モデル推論から、永続的かつマルチセッションの自律エージェントへの移行に伴い、生産環境レベルのエージェントシステムの展開において、メモリが主要なアーキテクチャ上のボトルネックであることが明らかになってきた。既存の手法の多くは、ハイブリッド意味グラフアーキテクチャに依存しており、情報の取り込みと検索の両方において多大な計算オーバーヘッドを課している。これらのシステムでは、一般に大規模言語モデルを用いたエンティティ抽出、明示的なグラフスキーマの維持、および複数クエリによる検索パイプラインが必要とされる。本論文は、高精度なエージェントメモリを実現するには知識グラフの複雑さが不可欠であるという従来の前提に異を唱える、エージェント人工知能のための普遍的なメモリ層「Memanto」を提案する。Memantoは、13の事前定義されたメモリカテゴリから構成される型付きセマンティックメモリスキーマ、自動化された競合解決メカニズム、および時間的バージョン管理を統合している。これらのコンポーネントは、Moorcheh情報理論検索エンジンによって実現されており、これはインデキシング不要なセマンティックデータベースであり、90ミリ秒未満のレイテンシで決定的な検索を提供するとともに、取り込み遅延を完全に排除する。LongMemEvalおよびLoCoMo評価スイートを用いた体系的なベンチマークを通じて、Memantoはそれぞれ89.8%および87.1%という最先端の精度スコアを達成した。これらの結果は、評価対象としたすべてのハイブリッドグラフおよびベクトルベースのシステムを上回るものであり、単一の検索クエリのみを必要とし、取り込みコストが発生せず、実質的に低い運用複雑性を維持している。各アーキテクチャコンポーネントの寄与を定量化するため、5段階の段階的アブレーション研究が提示され、その後、エージェントメモリシステムのスケーラブルな展開への示唆についての考察が行われる。
English
The transition from stateless language model inference to persistent, multi session autonomous agents has revealed memory to be a primary architectural bottleneck in the deployment of production grade agentic systems. Existing methodologies largely depend on hybrid semantic graph architectures, which impose substantial computational overhead during both ingestion and retrieval. These systems typically require large language model mediated entity extraction, explicit graph schema maintenance, and multi query retrieval pipelines. This paper introduces Memanto, a universal memory layer for agentic artificial intelligence that challenges the prevailing assumption that knowledge graph complexity is necessary to achieve high fidelity agent memory. Memanto integrates a typed semantic memory schema comprising thirteen predefined memory categories, an automated conflict resolution mechanism, and temporal versioning. These components are enabled by Moorcheh's Information Theoretic Search engine, a no indexing semantic database that provides deterministic retrieval within sub ninety millisecond latency while eliminating ingestion delay. Through systematic benchmarking on the LongMemEval and LoCoMo evaluation suites, Memanto achieves state of the art accuracy scores of 89.8 percent and 87.1 percent respectively. These results surpass all evaluated hybrid graph and vector based systems while requiring only a single retrieval query, incurring no ingestion cost, and maintaining substantially lower operational complexity. A five stage progressive ablation study is presented to quantify the contribution of each architectural component, followed by a discussion of the implications for scalable deployment of agentic memory systems.