大規模言語モデルを活用した会話型レコメンダーシステム
Leveraging Large Language Models in Conversational Recommender Systems
May 13, 2023
著者: Luke Friedman, Sameer Ahuja, David Allen, Terry Tan, Hakim Sidahmed, Changbo Long, Jun Xie, Gabriel Schubiner, Ajay Patel, Harsh Lara, Brian Chu, Zexi Chen, Manoj Tiwari
cs.AI
要旨
会話型レコメンデーションシステム(CRS)は、ユーザーがリアルタイムのマルチターン対話を通じてシステムとやり取りできるようにすることで、透明性と制御性を向上させます。最近、大規模言語モデル(LLM)は、自然な会話能力と世界知識や常識的推論を言語理解に取り込む前例のない能力を示し、このパラダイムの可能性を解き放ちました。しかし、CRS内でLLMを効果的に活用するには、複雑な会話を適切に理解し制御することや、外部情報源からの検索といった新しい技術的課題が生じます。これらの問題は、大規模で進化するアイテムコーパスや、トレーニング用の会話データの不足によってさらに悪化します。本論文では、LLMを使用したエンドツーエンドの大規模CRSを構築するためのロードマップを提供します。特に、ユーザー嗜好の理解、柔軟な対話管理、説明可能なレコメンデーションを統合アーキテクチャの一部としてLLMで実装する新しい方法を提案します。パーソナライゼーションを向上させるために、LLMが解釈可能な自然言語ユーザープロファイルを消費し、セッションレベルのコンテキストを調整する方法について説明します。既存のプロダクションCRSがない状況での会話データの制限を克服するために、制御可能なLLMベースのユーザーシミュレータを構築し、合成会話を生成する技術を提案します。概念実証として、LaMDA上に構築されたYouTube動画向けの大規模CRSであるRecLLMを紹介し、いくつかの例示的な会話を通じてその流暢さと多様な機能を実証します。
English
A Conversational Recommender System (CRS) offers increased transparency and
control to users by enabling them to engage with the system through a real-time
multi-turn dialogue. Recently, Large Language Models (LLMs) have exhibited an
unprecedented ability to converse naturally and incorporate world knowledge and
common-sense reasoning into language understanding, unlocking the potential of
this paradigm. However, effectively leveraging LLMs within a CRS introduces new
technical challenges, including properly understanding and controlling a
complex conversation and retrieving from external sources of information. These
issues are exacerbated by a large, evolving item corpus and a lack of
conversational data for training. In this paper, we provide a roadmap for
building an end-to-end large-scale CRS using LLMs. In particular, we propose
new implementations for user preference understanding, flexible dialogue
management and explainable recommendations as part of an integrated
architecture powered by LLMs. For improved personalization, we describe how an
LLM can consume interpretable natural language user profiles and use them to
modulate session-level context. To overcome conversational data limitations in
the absence of an existing production CRS, we propose techniques for building a
controllable LLM-based user simulator to generate synthetic conversations. As a
proof of concept we introduce RecLLM, a large-scale CRS for YouTube videos
built on LaMDA, and demonstrate its fluency and diverse functionality through
some illustrative example conversations.