Raccomandazioni Personalizzate di Audiolibri su Spotify Attraverso Reti Neurali a Grafo
Personalized Audiobook Recommendations at Spotify Through Graph Neural Networks
March 8, 2024
Autori: Marco De Nadai, Francesco Fabbri, Paul Gigioli, Alice Wang, Ang Li, Fabrizio Silvestri, Laura Kim, Shawn Lin, Vladan Radosavljevic, Sandeep Ghael, David Nyhan, Hugues Bouchard, Mounia Lalmas-Roelleke, Andreas Damianou
cs.AI
Abstract
Nel panorama digitale in continua evoluzione dell'audio, Spotify, noto per i suoi contenuti musicali e di intrattenimento, ha recentemente introdotto gli audiolibri alla sua vasta base di utenti. Sebbene promettente, questa mossa presenta sfide significative per le raccomandazioni personalizzate. A differenza della musica e dei podcast, gli audiolibri, inizialmente disponibili a pagamento, non possono essere facilmente sfogliati prima dell'acquisto, ponendo una maggiore importanza sulla pertinenza delle raccomandazioni. Inoltre, l'introduzione di un nuovo tipo di contenuto in una piattaforma esistente si scontra con un'estrema scarsità di dati, poiché la maggior parte degli utenti non ha familiarità con questo nuovo formato. Infine, raccomandare contenuti a milioni di utenti richiede che il modello reagisca rapidamente e sia scalabile. Per affrontare queste sfide, sfruttiamo le preferenze degli utenti per podcast e musica e introduciamo 2T-HGNN, un sistema di raccomandazione scalabile composto da Reti Neurali su Grafi Eterogenei (HGNN) e un modello Two Tower (2T). Questo approccio innovativo scopre relazioni sfumate tra gli elementi garantendo al contempo bassa latenza e complessità. Separiamo gli utenti dal grafo HGNN e proponiamo un innovativo campionatore di vicini multi-link. Queste scelte, insieme al componente 2T, riducono significativamente la complessità del modello HGNN. Valutazioni empiriche che coinvolgono milioni di utenti mostrano un miglioramento significativo nella qualità delle raccomandazioni personalizzate, con un aumento del +46% nel tasso di inizio di nuovi audiolibri e un incremento del +23% nei tassi di streaming. Curiosamente, l'impatto del nostro modello si estende oltre gli audiolibri, beneficiando prodotti consolidati come i podcast.
English
In the ever-evolving digital audio landscape, Spotify, well-known for its
music and talk content, has recently introduced audiobooks to its vast user
base. While promising, this move presents significant challenges for
personalized recommendations. Unlike music and podcasts, audiobooks, initially
available for a fee, cannot be easily skimmed before purchase, posing higher
stakes for the relevance of recommendations. Furthermore, introducing a new
content type into an existing platform confronts extreme data sparsity, as most
users are unfamiliar with this new content type. Lastly, recommending content
to millions of users requires the model to react fast and be scalable. To
address these challenges, we leverage podcast and music user preferences and
introduce 2T-HGNN, a scalable recommendation system comprising Heterogeneous
Graph Neural Networks (HGNNs) and a Two Tower (2T) model. This novel approach
uncovers nuanced item relationships while ensuring low latency and complexity.
We decouple users from the HGNN graph and propose an innovative multi-link
neighbor sampler. These choices, together with the 2T component, significantly
reduce the complexity of the HGNN model. Empirical evaluations involving
millions of users show significant improvement in the quality of personalized
recommendations, resulting in a +46% increase in new audiobooks start rate and
a +23% boost in streaming rates. Intriguingly, our model's impact extends
beyond audiobooks, benefiting established products like podcasts.