Conversation en session mixte avec mémoire égocentrique
Mixed-Session Conversation with Egocentric Memory
October 3, 2024
Auteurs: Jihyoung Jang, Taeyoung Kim, Hyounghun Kim
cs.AI
Résumé
Les systèmes de dialogue récemment introduits ont démontré une grande convivialité. Cependant, ils restent en deçà de refléter les scénarios de conversation du monde réel. Les systèmes de dialogue actuels présentent une incapacité à reproduire les interactions dynamiques, continues et à long terme impliquant plusieurs partenaires. Cette lacune survient car il y a eu peu d'efforts pour tenir compte des deux aspects des dialogues du monde réel : les interactions profondément stratifiées sur le long terme et les réseaux de conversation largement étendus impliquant de multiples participants. En combinant les efforts pour intégrer ces aspects, nous introduisons une Conversation en Sessions Mixtes, un système de dialogue conçu pour construire des conversations avec divers partenaires dans un cadre de dialogue multi-session. Nous proposons un nouvel ensemble de données appelé MiSC pour mettre en œuvre ce système. Les épisodes de dialogue de MiSC se composent de 6 sessions consécutives, avec quatre locuteurs (un locuteur principal et trois partenaires) apparaissant dans chaque épisode. De plus, nous proposons un nouveau modèle de dialogue avec un mécanisme de gestion de la mémoire novateur, appelé Agent de Conversation en Sessions Mixtes Amélioré par une Mémoire Égocentrique (EMMA). EMMA collecte et conserve les souvenirs du point de vue du locuteur principal lors des conversations avec les partenaires, permettant une continuité sans faille dans les interactions ultérieures. Des évaluations humaines approfondies valident que les dialogues dans MiSC démontrent un flux conversationnel fluide, même lorsque les partenaires de conversation changent à chaque session. EMMA formé avec MiSC est également évalué pour maintenir une haute mémorabilité sans contradiction tout au long de la conversation.
English
Recently introduced dialogue systems have demonstrated high usability.
However, they still fall short of reflecting real-world conversation scenarios.
Current dialogue systems exhibit an inability to replicate the dynamic,
continuous, long-term interactions involving multiple partners. This shortfall
arises because there have been limited efforts to account for both aspects of
real-world dialogues: deeply layered interactions over the long-term dialogue
and widely expanded conversation networks involving multiple participants. As
the effort to incorporate these aspects combined, we introduce Mixed-Session
Conversation, a dialogue system designed to construct conversations with
various partners in a multi-session dialogue setup. We propose a new dataset
called MiSC to implement this system. The dialogue episodes of MiSC consist of
6 consecutive sessions, with four speakers (one main speaker and three
partners) appearing in each episode. Also, we propose a new dialogue model with
a novel memory management mechanism, called Egocentric Memory Enhanced
Mixed-Session Conversation Agent (EMMA). EMMA collects and retains memories
from the main speaker's perspective during conversations with partners,
enabling seamless continuity in subsequent interactions. Extensive human
evaluations validate that the dialogues in MiSC demonstrate a seamless
conversational flow, even when conversation partners change in each session.
EMMA trained with MiSC is also evaluated to maintain high memorability without
contradiction throughout the entire conversation.Summary
AI-Generated Summary