MemFly: Echtzeit-Speicheroptimierung mittels Informationsflaschenhals

Zusammenfassung

Langzeitgedächtnis ermöglicht es Agenten auf Basis großer Sprachmodelle, komplexe Aufgaben durch historische Interaktionen zu bewältigen. Allerdings stehen bestehende Frameworks vor einem grundlegenden Dilemma zwischen effizienter Komprimierung redundanter Informationen und der Aufrechterhaltung präziser Abrufbarkeit für nachgelagerte Aufgaben. Um diese Lücke zu schließen, schlagen wir MemFly vor – ein Framework, das auf dem Prinzip der Informationsengstelle basiert und eine dynamische Gedächtnisentwicklung für LLMs ermöglicht. Unser Ansatz minimiert die Komprimierungsentropie und maximiert gleichzeitig die Relevanzentropie durch einen gradientenfreien Optimierer, wodurch eine geschichtete Gedächtnisstruktur für effiziente Speicherung aufgebaut wird. Um MemFly voll auszuschöpfen, entwickelten wir einen hybriden Abrufmechanismus, der semantische, symbolische und topologische Pfade nahtlos integriert und iterative Verfeinerung zur Bewältigung komplexer Multi-Hop-Abfragen einbezieht. Umfassende Experimente zeigen, dass MemFly state-of-the-art Baseline-Methoden in puncto Gedächtniskohärenz, Antworttreue und Genauigkeit erheblich übertrifft.

English

Long-term memory enables large language model agents to tackle complex tasks through historical interactions. However, existing frameworks encounter a fundamental dilemma between compressing redundant information efficiently and maintaining precise retrieval for downstream tasks. To bridge this gap, we propose MemFly, a framework grounded in information bottleneck principles that facilitates on-the-fly memory evolution for LLMs. Our approach minimizes compression entropy while maximizing relevance entropy via a gradient-free optimizer, constructing a stratified memory structure for efficient storage. To fully leverage MemFly, we develop a hybrid retrieval mechanism that seamlessly integrates semantic, symbolic, and topological pathways, incorporating iterative refinement to handle complex multi-hop queries. Comprehensive experiments demonstrate that MemFly substantially outperforms state-of-the-art baselines in memory coherence, response fidelity, and accuracy.

MemFly: Echtzeit-Speicheroptimierung mittels Informationsflaschenhals

MemFly: On-the-Fly Memory Optimization via Information Bottleneck

Zusammenfassung

Support