ChatPaper.aiChatPaper

MemFly: Otimização de Memória em Tempo Real via Gargalo de Informação

MemFly: On-the-Fly Memory Optimization via Information Bottleneck

February 8, 2026
Autores: Zhenyuan Zhang, Xianzhang Jia, Zhiqin Yang, Zhenbo Song, Wei Xue, Sirui Han, Yike Guo
cs.AI

Resumo

A memória de longo prazo permite que agentes de modelos de linguagem grande lidem com tarefas complexas por meio de interações históricas. No entanto, as estruturas existentes enfrentam um dilema fundamental entre comprimir informações redundantes de forma eficiente e manter uma recuperação precisa para tarefas subsequentes. Para preencher essa lacuna, propomos o MemFly, uma estrutura baseada nos princípios do *information bottleneck* que facilita a evolução da memória em tempo real para LLMs. Nossa abordagem minimiza a entropia de compressão enquanto maximiza a entropia de relevância por meio de um otimizador *gradient-free*, construindo uma estrutura de memória estratificada para armazenamento eficiente. Para aproveitar plenamente o MemFly, desenvolvemos um mecanismo de recuperação híbrido que integra perfeitamente vias semânticas, simbólicas e topológicas, incorporando refinamento iterativo para lidar com consultas complexas de múltiplos saltos. Experimentos abrangentes demonstram que o MemFly supera substancialmente os *baselines* state-of-the-art em coerência de memória, fidelidade de resposta e precisão.
English
Long-term memory enables large language model agents to tackle complex tasks through historical interactions. However, existing frameworks encounter a fundamental dilemma between compressing redundant information efficiently and maintaining precise retrieval for downstream tasks. To bridge this gap, we propose MemFly, a framework grounded in information bottleneck principles that facilitates on-the-fly memory evolution for LLMs. Our approach minimizes compression entropy while maximizing relevance entropy via a gradient-free optimizer, constructing a stratified memory structure for efficient storage. To fully leverage MemFly, we develop a hybrid retrieval mechanism that seamlessly integrates semantic, symbolic, and topological pathways, incorporating iterative refinement to handle complex multi-hop queries. Comprehensive experiments demonstrate that MemFly substantially outperforms state-of-the-art baselines in memory coherence, response fidelity, and accuracy.
PDF73March 17, 2026