Spotifyにおけるグラフニューラルネットワークを用いたパーソナライズされたオーディオブック推薦
Personalized Audiobook Recommendations at Spotify Through Graph Neural Networks
March 8, 2024
著者: Marco De Nadai, Francesco Fabbri, Paul Gigioli, Alice Wang, Ang Li, Fabrizio Silvestri, Laura Kim, Shawn Lin, Vladan Radosavljevic, Sandeep Ghael, David Nyhan, Hugues Bouchard, Mounia Lalmas-Roelleke, Andreas Damianou
cs.AI
要旨
絶えず進化するデジタルオーディオの世界において、音楽やトークコンテンツでよく知られるSpotifyは、最近その膨大なユーザーベースにオーディオブックを導入しました。この動きは有望ではあるものの、パーソナライズされたレコメンデーションにおいて重大な課題を提示しています。音楽やポッドキャストとは異なり、当初有料で提供されるオーディオブックは、購入前に簡単に流し読みすることができず、レコメンデーションの関連性に対するリスクが高くなります。さらに、既存のプラットフォームに新しいコンテンツタイプを導入することは、ほとんどのユーザーがこの新しいコンテンツタイプに不慣れであるため、極端なデータスパース性に直面します。最後に、何百万人ものユーザーにコンテンツを推薦するためには、モデルが迅速に反応し、スケーラブルである必要があります。これらの課題に対処するために、私たちはポッドキャストと音楽のユーザー嗜好を活用し、Heterogeneous Graph Neural Networks(HGNN)とTwo Tower(2T)モデルから構成されるスケーラブルなレコメンデーションシステムである2T-HGNNを導入します。この新しいアプローチは、低レイテンシと複雑性を確保しながら、微妙なアイテム間の関係を明らかにします。私たちはユーザーをHGNNグラフから分離し、革新的なマルチリンク近傍サンプラーを提案します。これらの選択と2Tコンポーネントにより、HGNNモデルの複雑性が大幅に削減されます。何百万人ものユーザーを対象とした実証評価では、パーソナライズされたレコメンデーションの品質が大幅に向上し、新しいオーディオブックの開始率が+46%増加し、ストリーミング率が+23%向上しました。興味深いことに、私たちのモデルの影響はオーディオブックを超えて、ポッドキャストなどの既存の製品にも恩恵をもたらしています。
English
In the ever-evolving digital audio landscape, Spotify, well-known for its
music and talk content, has recently introduced audiobooks to its vast user
base. While promising, this move presents significant challenges for
personalized recommendations. Unlike music and podcasts, audiobooks, initially
available for a fee, cannot be easily skimmed before purchase, posing higher
stakes for the relevance of recommendations. Furthermore, introducing a new
content type into an existing platform confronts extreme data sparsity, as most
users are unfamiliar with this new content type. Lastly, recommending content
to millions of users requires the model to react fast and be scalable. To
address these challenges, we leverage podcast and music user preferences and
introduce 2T-HGNN, a scalable recommendation system comprising Heterogeneous
Graph Neural Networks (HGNNs) and a Two Tower (2T) model. This novel approach
uncovers nuanced item relationships while ensuring low latency and complexity.
We decouple users from the HGNN graph and propose an innovative multi-link
neighbor sampler. These choices, together with the 2T component, significantly
reduce the complexity of the HGNN model. Empirical evaluations involving
millions of users show significant improvement in the quality of personalized
recommendations, resulting in a +46% increase in new audiobooks start rate and
a +23% boost in streaming rates. Intriguingly, our model's impact extends
beyond audiobooks, benefiting established products like podcasts.