Personalisierte Hörbuchempfehlungen bei Spotify durch Graph-Neuronale Netzwerke
Personalized Audiobook Recommendations at Spotify Through Graph Neural Networks
March 8, 2024
Autoren: Marco De Nadai, Francesco Fabbri, Paul Gigioli, Alice Wang, Ang Li, Fabrizio Silvestri, Laura Kim, Shawn Lin, Vladan Radosavljevic, Sandeep Ghael, David Nyhan, Hugues Bouchard, Mounia Lalmas-Roelleke, Andreas Damianou
cs.AI
Zusammenfassung
In der sich ständig weiterentwickelnden digitalen Audiolandschaft hat Spotify, bekannt für seine Musik- und Gesprächsinhalte, kürzlich Hörbücher seiner umfangreichen Nutzerbasis vorgestellt. Obwohl vielversprechend, birgt dieser Schritt bedeutende Herausforderungen für personalisierte Empfehlungen. Im Gegensatz zu Musik und Podcasts, die anfangs kostenpflichtig sind, können Hörbücher nicht einfach vor dem Kauf überflogen werden, was höhere Einsätze für die Relevanz von Empfehlungen bedeutet. Darüber hinaus führt die Einführung eines neuen Inhaltstyps in eine bestehende Plattform zu extremen Datenlücken, da die meisten Nutzer mit diesem neuen Inhaltstyp nicht vertraut sind. Schließlich erfordert die Empfehlung von Inhalten an Millionen von Nutzern, dass das Modell schnell reagiert und skalierbar ist. Um diesen Herausforderungen zu begegnen, nutzen wir die Vorlieben der Nutzer für Podcasts und Musik und stellen 2T-HGNN vor, ein skalierbares Empfehlungssystem, das aus Heterogenen Graph-Neuronalen Netzen (HGNNs) und einem Zwei-Turm (2T)-Modell besteht. Dieser neuartige Ansatz deckt fein abgestufte Artikelbeziehungen auf und gewährleistet dabei eine geringe Latenzzeit und Komplexität. Wir entkoppeln die Nutzer vom HGNN-Graphen und schlagen einen innovativen Multi-Link-Nachbarsampler vor. Diese Entscheidungen, zusammen mit dem 2T-Bestandteil, reduzieren die Komplexität des HGNN-Modells signifikant. Empirische Bewertungen mit Millionen von Nutzern zeigen eine signifikante Verbesserung der Qualität personalisierter Empfehlungen, was zu einer Steigerung der Startrate neuer Hörbücher um +46% und einer Erhöhung der Streamingraten um +23% führt. Interessanterweise erstreckt sich die Auswirkung unseres Modells über Hörbücher hinaus und kommt etablierten Produkten wie Podcasts zugute.
English
In the ever-evolving digital audio landscape, Spotify, well-known for its
music and talk content, has recently introduced audiobooks to its vast user
base. While promising, this move presents significant challenges for
personalized recommendations. Unlike music and podcasts, audiobooks, initially
available for a fee, cannot be easily skimmed before purchase, posing higher
stakes for the relevance of recommendations. Furthermore, introducing a new
content type into an existing platform confronts extreme data sparsity, as most
users are unfamiliar with this new content type. Lastly, recommending content
to millions of users requires the model to react fast and be scalable. To
address these challenges, we leverage podcast and music user preferences and
introduce 2T-HGNN, a scalable recommendation system comprising Heterogeneous
Graph Neural Networks (HGNNs) and a Two Tower (2T) model. This novel approach
uncovers nuanced item relationships while ensuring low latency and complexity.
We decouple users from the HGNN graph and propose an innovative multi-link
neighbor sampler. These choices, together with the 2T component, significantly
reduce the complexity of the HGNN model. Empirical evaluations involving
millions of users show significant improvement in the quality of personalized
recommendations, resulting in a +46% increase in new audiobooks start rate and
a +23% boost in streaming rates. Intriguingly, our model's impact extends
beyond audiobooks, benefiting established products like podcasts.