Conversación de Sesión Mixta con Memoria Egocéntrica
Mixed-Session Conversation with Egocentric Memory
October 3, 2024
Autores: Jihyoung Jang, Taeyoung Kim, Hyounghun Kim
cs.AI
Resumen
Los sistemas de diálogo recientemente introducidos han demostrado una alta usabilidad. Sin embargo, todavía no logran reflejar escenarios de conversación del mundo real. Los sistemas de diálogo actuales muestran una incapacidad para replicar las interacciones dinámicas, continuas y a largo plazo que involucran a múltiples interlocutores. Esta deficiencia surge debido a los esfuerzos limitados para tener en cuenta ambos aspectos de los diálogos del mundo real: interacciones profundamente estructuradas a lo largo del diálogo a largo plazo y redes de conversación ampliamente expandidas que involucran a múltiples participantes. Con el esfuerzo de incorporar estos aspectos combinados, presentamos la Conversación de Sesión Mixta, un sistema de diálogo diseñado para construir conversaciones con varios interlocutores en un entorno de diálogo de múltiples sesiones. Proponemos un nuevo conjunto de datos llamado MiSC para implementar este sistema. Los episodios de diálogo de MiSC constan de 6 sesiones consecutivas, con cuatro interlocutores (un interlocutor principal y tres interlocutores) que aparecen en cada episodio. Además, proponemos un nuevo modelo de diálogo con un mecanismo de gestión de memoria novedoso, llamado Agente de Conversación de Sesión Mixta con Memoria Egocéntrica Mejorada (EMMA). EMMA recopila y retiene recuerdos desde la perspectiva del interlocutor principal durante las conversaciones con los interlocutores, lo que permite una continuidad fluida en las interacciones posteriores. Evaluaciones humanas extensas validan que los diálogos en MiSC demuestran un flujo conversacional fluido, incluso cuando los interlocutores cambian en cada sesión. EMMA entrenado con MiSC también se evalúa para mantener una alta memorabilidad sin contradicciones a lo largo de toda la conversación.
English
Recently introduced dialogue systems have demonstrated high usability.
However, they still fall short of reflecting real-world conversation scenarios.
Current dialogue systems exhibit an inability to replicate the dynamic,
continuous, long-term interactions involving multiple partners. This shortfall
arises because there have been limited efforts to account for both aspects of
real-world dialogues: deeply layered interactions over the long-term dialogue
and widely expanded conversation networks involving multiple participants. As
the effort to incorporate these aspects combined, we introduce Mixed-Session
Conversation, a dialogue system designed to construct conversations with
various partners in a multi-session dialogue setup. We propose a new dataset
called MiSC to implement this system. The dialogue episodes of MiSC consist of
6 consecutive sessions, with four speakers (one main speaker and three
partners) appearing in each episode. Also, we propose a new dialogue model with
a novel memory management mechanism, called Egocentric Memory Enhanced
Mixed-Session Conversation Agent (EMMA). EMMA collects and retains memories
from the main speaker's perspective during conversations with partners,
enabling seamless continuity in subsequent interactions. Extensive human
evaluations validate that the dialogues in MiSC demonstrate a seamless
conversational flow, even when conversation partners change in each session.
EMMA trained with MiSC is also evaluated to maintain high memorability without
contradiction throughout the entire conversation.Summary
AI-Generated Summary