Mémoire épisodique humaine pour les LLM à contexte infini
Human-like Episodic Memory for Infinite Context LLMs
July 12, 2024
Auteurs: Zafeirios Fountas, Martin A Benfeghoul, Adnan Oomerjee, Fenia Christopoulou, Gerasimos Lampouras, Haitham Bou-Ammar, Jun Wang
cs.AI
Résumé
Les grands modèles de langage (LLM) ont démontré des capacités remarquables, mais peinent encore à traiter des contextes étendus, limitant leur aptitude à maintenir cohérence et précision sur de longues séquences. En revanche, le cerveau humain excelle dans l'organisation et la récupération d'expériences épisodiques à travers des échelles temporelles vastes, couvrant une vie entière. Dans ce travail, nous présentons EM-LLM, une approche novatrice qui intègre des aspects clés de la mémoire épisodique humaine et de la cognition événementielle dans les LLM, leur permettant de gérer efficacement des contextes de longueur pratiquement infinie tout en maintenant une efficacité computationnelle. EM-LLM organise les séquences de tokens en événements épisodiques cohérents en utilisant une combinaison de surprise bayésienne et de raffinement de frontières basé sur la théorie des graphes, de manière en ligne. Lorsque nécessaire, ces événements sont récupérés via un processus de mémoire en deux étapes, combinant une récupération basée sur la similarité et une récupération temporellement contiguë pour un accès efficace et humainement pertinent à l'information. Les expériences sur le jeu de données LongBench démontrent la performance supérieure d'EM-LLM, surpassant le modèle InfLLM de pointe avec une amélioration relative globale de 4,3% sur diverses tâches, incluant une amélioration de 33% sur la tâche de PassageRetrieval. De plus, notre analyse révèle de fortes corrélations entre la segmentation d'événements d'EM-LLM et les événements perçus par les humains, suggérant un pont entre ce système artificiel et son homologue biologique. Ce travail non seulement fait progresser les capacités des LLM dans le traitement de contextes étendus, mais fournit également un cadre computationnel pour explorer les mécanismes de la mémoire humaine, ouvrant de nouvelles voies pour la recherche interdisciplinaire en IA et en sciences cognitives.
English
Large language models (LLMs) have shown remarkable capabilities, but still
struggle with processing extensive contexts, limiting their ability to maintain
coherence and accuracy over long sequences. In contrast, the human brain excels
at organising and retrieving episodic experiences across vast temporal scales,
spanning a lifetime. In this work, we introduce EM-LLM, a novel approach that
integrates key aspects of human episodic memory and event cognition into LLMs,
enabling them to effectively handle practically infinite context lengths while
maintaining computational efficiency. EM-LLM organises sequences of tokens into
coherent episodic events using a combination of Bayesian surprise and
graph-theoretic boundary refinement in an on-line fashion. When needed, these
events are retrieved through a two-stage memory process, combining
similarity-based and temporally contiguous retrieval for efficient and
human-like access to relevant information. Experiments on the LongBench dataset
demonstrate EM-LLM's superior performance, outperforming the state-of-the-art
InfLLM model with an overall relative improvement of 4.3% across various tasks,
including a 33% improvement on the PassageRetrieval task. Furthermore, our
analysis reveals strong correlations between EM-LLM's event segmentation and
human-perceived events, suggesting a bridge between this artificial system and
its biological counterpart. This work not only advances LLM capabilities in
processing extended contexts but also provides a computational framework for
exploring human memory mechanisms, opening new avenues for interdisciplinary
research in AI and cognitive science.Summary
AI-Generated Summary