MemFly : Optimisation de la Mémoire à la Volée via le Goulot d'Étranglement Informationnel
MemFly: On-the-Fly Memory Optimization via Information Bottleneck
February 8, 2026
Auteurs: Zhenyuan Zhang, Xianzhang Jia, Zhiqin Yang, Zhenbo Song, Wei Xue, Sirui Han, Yike Guo
cs.AI
Résumé
La mémoire à long terme permet aux agents de modèles de langage de grande taille de traiter des tâches complexes grâce aux interactions historiques. Cependant, les frameworks existants se heurtent à un dilemme fondamental entre la compression efficace d'informations redondantes et le maintien d'une récupération précise pour les tâches en aval. Pour combler cette lacune, nous proposons MemFly, un framework fondé sur les principes du goulot d'étranglement informationnel qui facilite l'évolution dynamique de la mémoire pour les LLM. Notre approche minimise l'entropie de compression tout en maximisant l'entropie de pertinence via un optimiseur sans gradient, construisant une structure mémoire stratifiée pour un stockage efficace. Pour tirer pleinement parti de MemFly, nous développons un mécanisme de récupération hybride qui intègre de manière transparente des voies sémantiques, symboliques et topologiques, en incorporant un raffinement itératif pour gérer les requêtes multi-sauts complexes. Des expériences approfondies démontrent que MemFly surpasse substantiellement les meilleures méthodes de référence en cohérence mémorielle, fidélité des réponses et exactitude.
English
Long-term memory enables large language model agents to tackle complex tasks through historical interactions. However, existing frameworks encounter a fundamental dilemma between compressing redundant information efficiently and maintaining precise retrieval for downstream tasks. To bridge this gap, we propose MemFly, a framework grounded in information bottleneck principles that facilitates on-the-fly memory evolution for LLMs. Our approach minimizes compression entropy while maximizing relevance entropy via a gradient-free optimizer, constructing a stratified memory structure for efficient storage. To fully leverage MemFly, we develop a hybrid retrieval mechanism that seamlessly integrates semantic, symbolic, and topological pathways, incorporating iterative refinement to handle complex multi-hop queries. Comprehensive experiments demonstrate that MemFly substantially outperforms state-of-the-art baselines in memory coherence, response fidelity, and accuracy.