Многозадачное сквозное обучение повышает эффективность рекомендаций в диалоговых системах.
Multi-Task End-to-End Training Improves Conversational Recommendation
May 8, 2023
Авторы: Naveen Ram, Dima Kuzmin, Ellie Ka In Chio, Moustafa Farid Alzantot, Santiago Ontanon, Ambarish Jash, Judith Yue Li
cs.AI
Аннотация
В данной статье мы анализируем производительность многозадачной end-to-end трансформаторной модели в задаче рекомендаций в диалоге, цель которой — предоставлять рекомендации на основе явных предпочтений пользователя, выраженных в ходе беседы. В то время как предыдущие работы в этой области используют сложные многокомпонентные подходы, где управление диалогом и рекомендация сущностей выполняются отдельными компонентами, мы показываем, что унифицированная трансформаторная модель, основанная на T5 (текст-в-текст трансформаторной модели), может успешно справляться как с рекомендацией релевантных элементов, так и с генерацией диалога. Мы дообучаем нашу модель на наборе данных ReDIAL для рекомендации фильмов в диалоге и создаем дополнительные обучающие задачи на основе MovieLens (например, предсказание атрибутов фильма и связанных фильмов на основе входного фильма) в рамках многозадачного обучения. С помощью серии пробных исследований мы демонстрируем, что знания, полученные в дополнительных задачах, переносятся в контекст диалога, где каждая задача приводит к увеличению связанного пробного показателя на 9%-52%.
English
In this paper, we analyze the performance of a multitask end-to-end
transformer model on the task of conversational recommendations, which aim to
provide recommendations based on a user's explicit preferences expressed in
dialogue. While previous works in this area adopt complex multi-component
approaches where the dialogue management and entity recommendation tasks are
handled by separate components, we show that a unified transformer model, based
on the T5 text-to-text transformer model, can perform competitively in both
recommending relevant items and generating conversation dialogue. We fine-tune
our model on the ReDIAL conversational movie recommendation dataset, and create
additional training tasks derived from MovieLens (such as the prediction of
movie attributes and related movies based on an input movie), in a multitask
learning setting. Using a series of probe studies, we demonstrate that the
learned knowledge in the additional tasks is transferred to the conversational
setting, where each task leads to a 9%-52% increase in its related probe score.