Mémoire épisodique humaine pour les LLM à contexte infini

papers.abstract

Les grands modèles de langage (LLM) ont démontré des capacités remarquables, mais peinent encore à traiter des contextes étendus, limitant leur aptitude à maintenir cohérence et précision sur de longues séquences. En revanche, le cerveau humain excelle dans l'organisation et la récupération d'expériences épisodiques à travers des échelles temporelles vastes, couvrant une vie entière. Dans ce travail, nous présentons EM-LLM, une approche novatrice qui intègre des aspects clés de la mémoire épisodique humaine et de la cognition événementielle dans les LLM, leur permettant de gérer efficacement des contextes de longueur pratiquement infinie tout en maintenant une efficacité computationnelle. EM-LLM organise les séquences de tokens en événements épisodiques cohérents en utilisant une combinaison de surprise bayésienne et de raffinement de frontières basé sur la théorie des graphes, de manière en ligne. Lorsque nécessaire, ces événements sont récupérés via un processus de mémoire en deux étapes, combinant une récupération basée sur la similarité et une récupération temporellement contiguë pour un accès efficace et humainement pertinent à l'information. Les expériences sur le jeu de données LongBench démontrent la performance supérieure d'EM-LLM, surpassant le modèle InfLLM de pointe avec une amélioration relative globale de 4,3% sur diverses tâches, incluant une amélioration de 33% sur la tâche de PassageRetrieval. De plus, notre analyse révèle de fortes corrélations entre la segmentation d'événements d'EM-LLM et les événements perçus par les humains, suggérant un pont entre ce système artificiel et son homologue biologique. Ce travail non seulement fait progresser les capacités des LLM dans le traitement de contextes étendus, mais fournit également un cadre computationnel pour explorer les mécanismes de la mémoire humaine, ouvrant de nouvelles voies pour la recherche interdisciplinaire en IA et en sciences cognitives.

English

Large language models (LLMs) have shown remarkable capabilities, but still struggle with processing extensive contexts, limiting their ability to maintain coherence and accuracy over long sequences. In contrast, the human brain excels at organising and retrieving episodic experiences across vast temporal scales, spanning a lifetime. In this work, we introduce EM-LLM, a novel approach that integrates key aspects of human episodic memory and event cognition into LLMs, enabling them to effectively handle practically infinite context lengths while maintaining computational efficiency. EM-LLM organises sequences of tokens into coherent episodic events using a combination of Bayesian surprise and graph-theoretic boundary refinement in an on-line fashion. When needed, these events are retrieved through a two-stage memory process, combining similarity-based and temporally contiguous retrieval for efficient and human-like access to relevant information. Experiments on the LongBench dataset demonstrate EM-LLM's superior performance, outperforming the state-of-the-art InfLLM model with an overall relative improvement of 4.3% across various tasks, including a 33% improvement on the PassageRetrieval task. Furthermore, our analysis reveals strong correlations between EM-LLM's event segmentation and human-perceived events, suggesting a bridge between this artificial system and its biological counterpart. This work not only advances LLM capabilities in processing extended contexts but also provides a computational framework for exploring human memory mechanisms, opening new avenues for interdisciplinary research in AI and cognitive science.

Mémoire épisodique humaine pour les LLM à contexte infini

Human-like Episodic Memory for Infinite Context LLMs

papers.abstract

Support