MemFly: Optimización de Memoria en Tiempo Real mediante el Cuello de Botella de Información

Resumen

La memoria de largo plazo permite a los agentes de modelos de lenguaje grande abordar tareas complejas mediante interacciones históricas. Sin embargo, los marcos existentes se enfrentan a un dilema fundamental entre comprimir información redundante de manera eficiente y mantener una recuperación precisa para las tareas posteriores. Para salvar esta brecha, proponemos MemFly, un marco basado en los principios del cuello de botella de la información que facilita la evolución de la memoria en tiempo real para los LLM. Nuestro enfoque minimiza la entropía de compresión mientras maximiza la entropía de relevancia mediante un optimizador libre de gradientes, construyendo una estructura de memoria estratificada para un almacenamiento eficiente. Para aprovechar al máximo MemFly, desarrollamos un mecanismo de recuperación híbrido que integra de manera fluida vías semánticas, simbólicas y topológicas, incorporando una refinación iterativa para manejar consultas complejas de múltiples saltos. Experimentos exhaustivos demuestran que MemFly supera sustancialmente a los métodos de referencia más avanzados en coherencia de memoria, fidelidad de respuesta y precisión.

English

Long-term memory enables large language model agents to tackle complex tasks through historical interactions. However, existing frameworks encounter a fundamental dilemma between compressing redundant information efficiently and maintaining precise retrieval for downstream tasks. To bridge this gap, we propose MemFly, a framework grounded in information bottleneck principles that facilitates on-the-fly memory evolution for LLMs. Our approach minimizes compression entropy while maximizing relevance entropy via a gradient-free optimizer, constructing a stratified memory structure for efficient storage. To fully leverage MemFly, we develop a hybrid retrieval mechanism that seamlessly integrates semantic, symbolic, and topological pathways, incorporating iterative refinement to handle complex multi-hop queries. Comprehensive experiments demonstrate that MemFly substantially outperforms state-of-the-art baselines in memory coherence, response fidelity, and accuracy.