MemFly: Ottimizzazione della Memoria On-the-Fly tramite Collo di Bottiglia Informativo
MemFly: On-the-Fly Memory Optimization via Information Bottleneck
February 8, 2026
Autori: Zhenyuan Zhang, Xianzhang Jia, Zhiqin Yang, Zhenbo Song, Wei Xue, Sirui Han, Yike Guo
cs.AI
Abstract
La memoria a lungo termine consente agli agenti basati su grandi modelli linguistici di affrontare compiti complessi attraverso interazioni storiche. Tuttavia, i framework esistenti incontrano un dilemma fondamentale tra la compressione efficiente delle informazioni ridondanti e il mantenimento di un recupero preciso per i task downstream. Per colmare questa lacuna, proponiamo MemFly, un framework basato sui principi del collo di bottiglia informativo che facilita l'evoluzione dinamica della memoria per i LLM. Il nostro approccio minimizza l'entropia di compressione mentre massimizza l'entropia di rilevanza tramite un ottimizzatore senza gradienti, costruendo una struttura di memoria stratificata per una memorizzazione efficiente. Per sfruttare appieno MemFly, sviluppiamo un meccanismo di recupero ibrido che integra perfettamente percorsi semantici, simbolici e topologici, incorporando un raffinamento iterativo per gestire query complesse multi-hop. Esperimenti completi dimostrano che MemFly supera sostanzialmente i baseline state-of-the-art in coerenza della memoria, fedeltà delle risposte e accuratezza.
English
Long-term memory enables large language model agents to tackle complex tasks through historical interactions. However, existing frameworks encounter a fundamental dilemma between compressing redundant information efficiently and maintaining precise retrieval for downstream tasks. To bridge this gap, we propose MemFly, a framework grounded in information bottleneck principles that facilitates on-the-fly memory evolution for LLMs. Our approach minimizes compression entropy while maximizing relevance entropy via a gradient-free optimizer, constructing a stratified memory structure for efficient storage. To fully leverage MemFly, we develop a hybrid retrieval mechanism that seamlessly integrates semantic, symbolic, and topological pathways, incorporating iterative refinement to handle complex multi-hop queries. Comprehensive experiments demonstrate that MemFly substantially outperforms state-of-the-art baselines in memory coherence, response fidelity, and accuracy.