ChatPaper.aiChatPaper

Memanto: Memoria Semántica Tipada con Recuperación de Información Teórica para Agentes de Horizonte Largo

Memanto: Typed Semantic Memory with Information-Theoretic Retrieval for Long-Horizon Agents

April 23, 2026
Autores: Seyed Moein Abtahi, Rasa Rahnema, Hetkumar Patel, Neel Patel, Majid Fekri, Tara Khani
cs.AI

Resumen

La transición desde la inferencia de modelos de lenguaje sin estado hacia agentes autónomos persistentes y multisession ha revelado que la memoria constituye un cuello de botella arquitectónico principal en el despliegue de sistemas agentivos de grado productivo. Las metodologías existentes dependen en gran medida de arquitecturas híbridas de grafos semánticos, que imponen una sobrecarga computacional sustancial durante tanto la ingesta como la recuperación. Estos sistemas típicamente requieren la extracción de entidades mediada por modelos de lenguaje grandes, el mantenimiento explícito de esquemas de grafos y pipelines de recuperación de múltiples consultas. Este artículo presenta a Memanto, una capa de memoria universal para la inteligencia artificial agentiva que desafía la suposición predominante de que la complejidad de los grafos de conocimiento es necesaria para lograr una memoria de agente de alta fidelidad. Memanto integra un esquema de memoria semántica tipada que comprende trece categorías de memoria predefinidas, un mecanismo automático de resolución de conflictos y un versionamiento temporal. Estos componentes están habilitados por el motor de búsqueda de Moorcheh basado en Teoría de la Información, una base de datos semántica sin indexación que proporciona una recuperación determinista con latencias inferiores a noventa milisegundos y elimina el retraso por ingesta. Mediante la evaluación sistemática en los conjuntos de pruebas LongMemEval y LoCoMo, Memanto alcanza puntuaciones de precisión state-of-the-art del 89.8 por ciento y 87.1 por ciento respectivamente. Estos resultados superan a todos los sistemas híbridos basados en grafos y vectores evaluados, requiriendo únicamente una única consulta de recuperación, sin incurrir en coste de ingesta y manteniendo una complejidad operativa sustancialmente menor. Se presenta un estudio de ablación progresiva de cinco etapas para cuantificar la contribución de cada componente arquitectónico, seguido de una discusión sobre las implicaciones para el despliegue escalable de sistemas de memoria agentivos.
English
The transition from stateless language model inference to persistent, multi session autonomous agents has revealed memory to be a primary architectural bottleneck in the deployment of production grade agentic systems. Existing methodologies largely depend on hybrid semantic graph architectures, which impose substantial computational overhead during both ingestion and retrieval. These systems typically require large language model mediated entity extraction, explicit graph schema maintenance, and multi query retrieval pipelines. This paper introduces Memanto, a universal memory layer for agentic artificial intelligence that challenges the prevailing assumption that knowledge graph complexity is necessary to achieve high fidelity agent memory. Memanto integrates a typed semantic memory schema comprising thirteen predefined memory categories, an automated conflict resolution mechanism, and temporal versioning. These components are enabled by Moorcheh's Information Theoretic Search engine, a no indexing semantic database that provides deterministic retrieval within sub ninety millisecond latency while eliminating ingestion delay. Through systematic benchmarking on the LongMemEval and LoCoMo evaluation suites, Memanto achieves state of the art accuracy scores of 89.8 percent and 87.1 percent respectively. These results surpass all evaluated hybrid graph and vector based systems while requiring only a single retrieval query, incurring no ingestion cost, and maintaining substantially lower operational complexity. A five stage progressive ablation study is presented to quantify the contribution of each architectural component, followed by a discussion of the implications for scalable deployment of agentic memory systems.
PDF63April 28, 2026