Разговор с смешанными сессиями и эгоцентричной памятью
Mixed-Session Conversation with Egocentric Memory
October 3, 2024
Авторы: Jihyoung Jang, Taeyoung Kim, Hyounghun Kim
cs.AI
Аннотация
Недавно представленные системы диалога продемонстрировали высокую удобство использования. Однако они все еще не способны отражать сценарии разговоров в реальном мире. Текущие системы диалога проявляют неспособность воспроизводить динамичные, непрерывные, долгосрочные взаимодействия с участием нескольких партнеров. Этот недостаток возникает из-за ограниченных усилий по учету обоих аспектов реальных диалогов: глубоких слоистых взаимодействий в течение долгого диалога и широко расширенных сетей разговора с участием нескольких участников. В результате усилий по включению этих аспектов мы представляем Mixed-Session Conversation, систему диалога, разработанную для создания разговоров с различными партнерами в многосессионной настройке диалога. Мы предлагаем новый набор данных под названием MiSC для реализации этой системы. Диалоговые эпизоды MiSC состоят из 6 последовательных сессий, в каждом эпизоде участвуют четыре диктора (один основной диктор и три партнера). Кроме того, мы предлагаем новую модель диалога с новым механизмом управления памятью, называемую Агент Диалога с Улучшенной Эгоцентрической Памятью для Смешанных Сессий (EMMA). EMMA собирает и сохраняет воспоминания с точки зрения основного диктора во время разговоров с партнерами, обеспечивая бесперебойную непрерывность в последующих взаимодействиях. Обширные оценки людей подтверждают, что диалоги в MiSC демонстрируют плавный разговорный поток, даже когда партнеры разговора меняются в каждой сессии. EMMA, обученная на MiSC, также оценивается на способность сохранять высокую запоминаемость без противоречий на протяжении всего разговора.
English
Recently introduced dialogue systems have demonstrated high usability.
However, they still fall short of reflecting real-world conversation scenarios.
Current dialogue systems exhibit an inability to replicate the dynamic,
continuous, long-term interactions involving multiple partners. This shortfall
arises because there have been limited efforts to account for both aspects of
real-world dialogues: deeply layered interactions over the long-term dialogue
and widely expanded conversation networks involving multiple participants. As
the effort to incorporate these aspects combined, we introduce Mixed-Session
Conversation, a dialogue system designed to construct conversations with
various partners in a multi-session dialogue setup. We propose a new dataset
called MiSC to implement this system. The dialogue episodes of MiSC consist of
6 consecutive sessions, with four speakers (one main speaker and three
partners) appearing in each episode. Also, we propose a new dialogue model with
a novel memory management mechanism, called Egocentric Memory Enhanced
Mixed-Session Conversation Agent (EMMA). EMMA collects and retains memories
from the main speaker's perspective during conversations with partners,
enabling seamless continuity in subsequent interactions. Extensive human
evaluations validate that the dialogues in MiSC demonstrate a seamless
conversational flow, even when conversation partners change in each session.
EMMA trained with MiSC is also evaluated to maintain high memorability without
contradiction throughout the entire conversation.Summary
AI-Generated Summary