Gepersonaliseerde Audioboekaanbevelingen bij Spotify via Grafische Neurale Netwerken
Personalized Audiobook Recommendations at Spotify Through Graph Neural Networks
March 8, 2024
Auteurs: Marco De Nadai, Francesco Fabbri, Paul Gigioli, Alice Wang, Ang Li, Fabrizio Silvestri, Laura Kim, Shawn Lin, Vladan Radosavljevic, Sandeep Ghael, David Nyhan, Hugues Bouchard, Mounia Lalmas-Roelleke, Andreas Damianou
cs.AI
Samenvatting
In het voortdurend evoluerende digitale audiolandschap heeft Spotify, bekend om zijn muziek- en praatcontent, onlangs luisterboeken geïntroduceerd voor zijn grote gebruikersbasis. Hoewel veelbelovend, brengt deze stap aanzienlijke uitdagingen met zich mee voor gepersonaliseerde aanbevelingen. In tegenstelling tot muziek en podcasts kunnen luisterboeken, die aanvankelijk tegen betaling beschikbaar zijn, niet eenvoudig worden doorgebladerd voordat ze worden aangeschaft, wat hogere inzet betekent voor de relevantie van aanbevelingen. Bovendien stuit de introductie van een nieuw contenttype op een bestaand platform op extreme dataschaarste, aangezien de meeste gebruikers niet vertrouwd zijn met dit nieuwe contenttype. Ten slotte vereist het aanbevelen van content aan miljoenen gebruikers dat het model snel reageert en schaalbaar is. Om deze uitdagingen aan te pakken, maken we gebruik van gebruikersvoorkeuren voor podcasts en muziek en introduceren we 2T-HGNN, een schaalbaar aanbevelingssysteem bestaande uit Heterogene Grafische Neurale Netwerken (HGNN's) en een Two Tower (2T)-model. Deze nieuwe aanpak onthult genuanceerde itemrelaties terwijl een lage latentie en complexiteit worden gegarandeerd. We ontkoppelen gebruikers van de HGNN-grafiek en introduceren een innovatieve multi-link neighbor sampler. Deze keuzes, samen met het 2T-component, verminderen de complexiteit van het HGNN-model aanzienlijk. Empirische evaluaties met miljoenen gebruikers tonen een aanzienlijke verbetering in de kwaliteit van gepersonaliseerde aanbevelingen, wat resulteert in een stijging van 46% in het startpercentage van nieuwe luisterboeken en een toename van 23% in de streamingsnelheden. Interessant genoeg strekt de impact van ons model zich uit tot voorbij luisterboeken, waardoor ook gevestigde producten zoals podcasts ervan profiteren.
English
In the ever-evolving digital audio landscape, Spotify, well-known for its
music and talk content, has recently introduced audiobooks to its vast user
base. While promising, this move presents significant challenges for
personalized recommendations. Unlike music and podcasts, audiobooks, initially
available for a fee, cannot be easily skimmed before purchase, posing higher
stakes for the relevance of recommendations. Furthermore, introducing a new
content type into an existing platform confronts extreme data sparsity, as most
users are unfamiliar with this new content type. Lastly, recommending content
to millions of users requires the model to react fast and be scalable. To
address these challenges, we leverage podcast and music user preferences and
introduce 2T-HGNN, a scalable recommendation system comprising Heterogeneous
Graph Neural Networks (HGNNs) and a Two Tower (2T) model. This novel approach
uncovers nuanced item relationships while ensuring low latency and complexity.
We decouple users from the HGNN graph and propose an innovative multi-link
neighbor sampler. These choices, together with the 2T component, significantly
reduce the complexity of the HGNN model. Empirical evaluations involving
millions of users show significant improvement in the quality of personalized
recommendations, resulting in a +46% increase in new audiobooks start rate and
a +23% boost in streaming rates. Intriguingly, our model's impact extends
beyond audiobooks, benefiting established products like podcasts.