L'Addestramento End-to-End Multi-Task Migliora la Raccomandazione Conversazionale
Multi-Task End-to-End Training Improves Conversational Recommendation
May 8, 2023
Autori: Naveen Ram, Dima Kuzmin, Ellie Ka In Chio, Moustafa Farid Alzantot, Santiago Ontanon, Ambarish Jash, Judith Yue Li
cs.AI
Abstract
In questo articolo, analizziamo le prestazioni di un modello transformer end-to-end multitask nel compito di raccomandazioni conversazionali, che mirano a fornire suggerimenti basati sulle preferenze esplicite di un utente espresse in un dialogo. Mentre i lavori precedenti in questo ambito adottano approcci multi-componente complessi in cui la gestione del dialogo e il compito di raccomandazione di entità sono gestiti da componenti separati, dimostriamo che un modello transformer unificato, basato sul modello transformer text-to-text T5, può competere sia nel raccomandare elementi rilevanti che nel generare dialoghi conversazionali. Ottimizziamo il nostro modello sul dataset di raccomandazione conversazionale di film ReDIAL e creiamo ulteriori compiti di addestramento derivati da MovieLens (come la previsione di attributi dei film e di film correlati basati su un film di input), in un contesto di apprendimento multitask. Utilizzando una serie di studi di indagine, dimostriamo che la conoscenza appresa nei compiti aggiuntivi viene trasferita al contesto conversazionale, dove ogni compito porta a un aumento del 9%-52% nel punteggio della relativa indagine.
English
In this paper, we analyze the performance of a multitask end-to-end
transformer model on the task of conversational recommendations, which aim to
provide recommendations based on a user's explicit preferences expressed in
dialogue. While previous works in this area adopt complex multi-component
approaches where the dialogue management and entity recommendation tasks are
handled by separate components, we show that a unified transformer model, based
on the T5 text-to-text transformer model, can perform competitively in both
recommending relevant items and generating conversation dialogue. We fine-tune
our model on the ReDIAL conversational movie recommendation dataset, and create
additional training tasks derived from MovieLens (such as the prediction of
movie attributes and related movies based on an input movie), in a multitask
learning setting. Using a series of probe studies, we demonstrate that the
learned knowledge in the additional tasks is transferred to the conversational
setting, where each task leads to a 9%-52% increase in its related probe score.