MemFly: On-the-Fly Geheugenoptimalisatie via het Informatie-Knelpunt
MemFly: On-the-Fly Memory Optimization via Information Bottleneck
February 8, 2026
Auteurs: Zhenyuan Zhang, Xianzhang Jia, Zhiqin Yang, Zhenbo Song, Wei Xue, Sirui Han, Yike Guo
cs.AI
Samenvatting
Langetermijngeheugen stelt taalmodelagenten in staat om complexe taken aan te pakken door middel van historische interacties. Bestaande frameworks kampen echter met een fundamenteel dilemma tussen het efficiënt comprimeren van redundante informatie en het behouden van precieze retrievability voor downstreamtaken. Om deze kloof te overbruggen, stellen we MemFly voor: een raamwerk gebaseerd op informatiebottleneck-principes dat dynamische geheugenevolutie voor taalmodellen mogelijk maakt. Onze aanpak minimaliseert compressie-entropie terwijl het relevantie-entropie maximaliseert via een gradient-vrije optimizer, waardoor een gelaagde geheugenstructuur voor efficiënte opslag wordt geconstrueerd. Om MemFly optimaal te benutten, ontwikkelden we een hybride retrievalmechanisme dat semantische, symbolische en topologische paden naadloos integreert, met iteratieve verfijning om complexe multi-hop queries te verwerken. Uitgebreide experimenten tonen aan dat MemFly state-of-the-art baseline-methoden aanzienlijk overtreft op het gebied van geheugencoherentie, responsbetrouwbaarheid en nauwkeurigheid.
English
Long-term memory enables large language model agents to tackle complex tasks through historical interactions. However, existing frameworks encounter a fundamental dilemma between compressing redundant information efficiently and maintaining precise retrieval for downstream tasks. To bridge this gap, we propose MemFly, a framework grounded in information bottleneck principles that facilitates on-the-fly memory evolution for LLMs. Our approach minimizes compression entropy while maximizing relevance entropy via a gradient-free optimizer, constructing a stratified memory structure for efficient storage. To fully leverage MemFly, we develop a hybrid retrieval mechanism that seamlessly integrates semantic, symbolic, and topological pathways, incorporating iterative refinement to handle complex multi-hop queries. Comprehensive experiments demonstrate that MemFly substantially outperforms state-of-the-art baselines in memory coherence, response fidelity, and accuracy.