Recomendações Personalizadas de Audiobooks no Spotify por meio de Redes Neurais em Grafos
Personalized Audiobook Recommendations at Spotify Through Graph Neural Networks
March 8, 2024
Autores: Marco De Nadai, Francesco Fabbri, Paul Gigioli, Alice Wang, Ang Li, Fabrizio Silvestri, Laura Kim, Shawn Lin, Vladan Radosavljevic, Sandeep Ghael, David Nyhan, Hugues Bouchard, Mounia Lalmas-Roelleke, Andreas Damianou
cs.AI
Resumo
No cenário em constante evolução do áudio digital, o Spotify, conhecido por seu conteúdo musical e de podcasts, recentemente introduziu audiolivros para sua vasta base de usuários. Embora promissora, essa iniciativa apresenta desafios significativos para as recomendações personalizadas. Diferente de músicas e podcasts, os audiolivros, inicialmente disponíveis mediante pagamento, não podem ser facilmente "folheados" antes da compra, o que eleva a importância da relevância das recomendações. Além disso, a introdução de um novo tipo de conteúdo em uma plataforma existente enfrenta uma extrema escassez de dados, já que a maioria dos usuários não está familiarizada com esse novo formato. Por fim, recomendar conteúdo para milhões de usuários exige que o modelo seja rápido e escalável. Para enfrentar esses desafios, utilizamos as preferências dos usuários em relação a podcasts e músicas e introduzimos o 2T-HGNN, um sistema de recomendação escalável que combina Redes Neurais em Grafos Heterogêneos (HGNNs) e um modelo Two Tower (2T). Essa abordagem inovadora revela relações sutis entre os itens, garantindo baixa latência e complexidade. Desacoplamos os usuários do grafo HGNN e propomos um amostrador de vizinhos multi-link inovador. Essas escolhas, juntamente com o componente 2T, reduzem significativamente a complexidade do modelo HGNN. Avaliações empíricas envolvendo milhões de usuários mostram uma melhoria significativa na qualidade das recomendações personalizadas, resultando em um aumento de +46% na taxa de início de novos audiolivros e um crescimento de +23% nas taxas de streaming. Curiosamente, o impacto do nosso modelo vai além dos audiolivros, beneficiando produtos consolidados, como podcasts.
English
In the ever-evolving digital audio landscape, Spotify, well-known for its
music and talk content, has recently introduced audiobooks to its vast user
base. While promising, this move presents significant challenges for
personalized recommendations. Unlike music and podcasts, audiobooks, initially
available for a fee, cannot be easily skimmed before purchase, posing higher
stakes for the relevance of recommendations. Furthermore, introducing a new
content type into an existing platform confronts extreme data sparsity, as most
users are unfamiliar with this new content type. Lastly, recommending content
to millions of users requires the model to react fast and be scalable. To
address these challenges, we leverage podcast and music user preferences and
introduce 2T-HGNN, a scalable recommendation system comprising Heterogeneous
Graph Neural Networks (HGNNs) and a Two Tower (2T) model. This novel approach
uncovers nuanced item relationships while ensuring low latency and complexity.
We decouple users from the HGNN graph and propose an innovative multi-link
neighbor sampler. These choices, together with the 2T component, significantly
reduce the complexity of the HGNN model. Empirical evaluations involving
millions of users show significant improvement in the quality of personalized
recommendations, resulting in a +46% increase in new audiobooks start rate and
a +23% boost in streaming rates. Intriguingly, our model's impact extends
beyond audiobooks, benefiting established products like podcasts.