Персонализированные рекомендации аудиокниг на Spotify с использованием графовых нейронных сетей
Personalized Audiobook Recommendations at Spotify Through Graph Neural Networks
March 8, 2024
Авторы: Marco De Nadai, Francesco Fabbri, Paul Gigioli, Alice Wang, Ang Li, Fabrizio Silvestri, Laura Kim, Shawn Lin, Vladan Radosavljevic, Sandeep Ghael, David Nyhan, Hugues Bouchard, Mounia Lalmas-Roelleke, Andreas Damianou
cs.AI
Аннотация
В постоянно изменяющемся цифровом аудио-ландшафте Spotify, хорошо известный своим музыкальным и разговорным контентом, недавно представил аудиокниги своей огромной пользовательской базе. Хотя это обещает быть перспективным, такой шаг представляет существенные вызовы для персонализированных рекомендаций. В отличие от музыки и подкастов, аудиокниги, изначально доступные за плату, нельзя легко просмотреть перед покупкой, что создает более высокие ставки для актуальности рекомендаций. Кроме того, внедрение нового типа контента на существующую платформу сталкивается с крайне низкой плотностью данных, поскольку большинство пользователей не знакомы с этим новым типом контента. Наконец, рекомендация контента миллионам пользователей требует от модели быстрой реакции и масштабируемости. Для решения этих проблем мы используем предпочтения пользователей подкастов и музыки и представляем 2T-HGNN, масштабируемую систему рекомендаций, включающую в себя Графовые Нейронные Сети Гетерогенного Типа (HGNN) и модель Двух Башен (2T). Этот новаторский подход раскрывает тонкие отношения между элементами, обеспечивая при этом низкую задержку и сложность. Мы разделяем пользователей от графа HGNN и предлагаем инновационный мульти-сэмплер соседей. Эти выборы, вместе с компонентом 2T, значительно снижают сложность модели HGNN. Эмпирические оценки, включающие миллионы пользователей, показывают значительное улучшение качества персонализированных рекомендаций, что приводит к увеличению стартовой частоты новых аудиокниг на +46% и увеличению частоты потокового воспроизведения на +23%. Интригующим образом, влияние нашей модели распространяется за пределы аудиокниг, принося пользу уже установившимся продуктам, таким как подкасты.
English
In the ever-evolving digital audio landscape, Spotify, well-known for its
music and talk content, has recently introduced audiobooks to its vast user
base. While promising, this move presents significant challenges for
personalized recommendations. Unlike music and podcasts, audiobooks, initially
available for a fee, cannot be easily skimmed before purchase, posing higher
stakes for the relevance of recommendations. Furthermore, introducing a new
content type into an existing platform confronts extreme data sparsity, as most
users are unfamiliar with this new content type. Lastly, recommending content
to millions of users requires the model to react fast and be scalable. To
address these challenges, we leverage podcast and music user preferences and
introduce 2T-HGNN, a scalable recommendation system comprising Heterogeneous
Graph Neural Networks (HGNNs) and a Two Tower (2T) model. This novel approach
uncovers nuanced item relationships while ensuring low latency and complexity.
We decouple users from the HGNN graph and propose an innovative multi-link
neighbor sampler. These choices, together with the 2T component, significantly
reduce the complexity of the HGNN model. Empirical evaluations involving
millions of users show significant improvement in the quality of personalized
recommendations, resulting in a +46% increase in new audiobooks start rate and
a +23% boost in streaming rates. Intriguingly, our model's impact extends
beyond audiobooks, benefiting established products like podcasts.Summary
AI-Generated Summary