Recomendaciones personalizadas de audiolibros en Spotify mediante redes neuronales de grafos
Personalized Audiobook Recommendations at Spotify Through Graph Neural Networks
March 8, 2024
Autores: Marco De Nadai, Francesco Fabbri, Paul Gigioli, Alice Wang, Ang Li, Fabrizio Silvestri, Laura Kim, Shawn Lin, Vladan Radosavljevic, Sandeep Ghael, David Nyhan, Hugues Bouchard, Mounia Lalmas-Roelleke, Andreas Damianou
cs.AI
Resumen
En el panorama digital del audio en constante evolución, Spotify, conocido por su contenido musical y de charlas, ha introducido recientemente audiolibros a su amplia base de usuarios. Aunque prometedor, este movimiento presenta desafíos significativos para las recomendaciones personalizadas. A diferencia de la música y los podcasts, los audiolibros, inicialmente disponibles por un costo, no pueden ser fácilmente hojeados antes de la compra, lo que aumenta la importancia de la relevancia de las recomendaciones. Además, la introducción de un nuevo tipo de contenido en una plataforma existente enfrenta una extrema escasez de datos, ya que la mayoría de los usuarios no están familiarizados con este nuevo tipo de contenido. Por último, recomendar contenido a millones de usuarios requiere que el modelo reaccione rápidamente y sea escalable. Para abordar estos desafíos, aprovechamos las preferencias de los usuarios de podcasts y música e introducimos 2T-HGNN, un sistema de recomendación escalable que comprende Redes Neuronales de Grafos Heterogéneos (HGNNs) y un modelo de Dos Torres (2T). Este enfoque novedoso descubre relaciones matizadas entre los ítems mientras asegura baja latencia y complejidad. Desacoplamos a los usuarios del grafo HGNN y proponemos un innovador muestreador de vecinos multi-enlace. Estas elecciones, junto con el componente 2T, reducen significativamente la complejidad del modelo HGNN. Las evaluaciones empíricas que involucran a millones de usuarios muestran una mejora significativa en la calidad de las recomendaciones personalizadas, resultando en un aumento del +46% en la tasa de inicio de nuevos audiolibros y un incremento del +23% en las tasas de streaming. Curiosamente, el impacto de nuestro modelo se extiende más allá de los audiolibros, beneficiando a productos establecidos como los podcasts.
English
In the ever-evolving digital audio landscape, Spotify, well-known for its
music and talk content, has recently introduced audiobooks to its vast user
base. While promising, this move presents significant challenges for
personalized recommendations. Unlike music and podcasts, audiobooks, initially
available for a fee, cannot be easily skimmed before purchase, posing higher
stakes for the relevance of recommendations. Furthermore, introducing a new
content type into an existing platform confronts extreme data sparsity, as most
users are unfamiliar with this new content type. Lastly, recommending content
to millions of users requires the model to react fast and be scalable. To
address these challenges, we leverage podcast and music user preferences and
introduce 2T-HGNN, a scalable recommendation system comprising Heterogeneous
Graph Neural Networks (HGNNs) and a Two Tower (2T) model. This novel approach
uncovers nuanced item relationships while ensuring low latency and complexity.
We decouple users from the HGNN graph and propose an innovative multi-link
neighbor sampler. These choices, together with the 2T component, significantly
reduce the complexity of the HGNN model. Empirical evaluations involving
millions of users show significant improvement in the quality of personalized
recommendations, resulting in a +46% increase in new audiobooks start rate and
a +23% boost in streaming rates. Intriguingly, our model's impact extends
beyond audiobooks, benefiting established products like podcasts.