그래프 신경망을 활용한 Spotify의 개인 맞춤형 오디오북 추천 시스템
Personalized Audiobook Recommendations at Spotify Through Graph Neural Networks
March 8, 2024
저자: Marco De Nadai, Francesco Fabbri, Paul Gigioli, Alice Wang, Ang Li, Fabrizio Silvestri, Laura Kim, Shawn Lin, Vladan Radosavljevic, Sandeep Ghael, David Nyhan, Hugues Bouchard, Mounia Lalmas-Roelleke, Andreas Damianou
cs.AI
초록
끊임없이 진화하는 디지털 오디오 환경에서 음악 및 토크 콘텐츠로 잘 알려진 Spotify는 최근 방대한 사용자 기반에 오디오북을 도입했습니다. 이는 유망한 움직임이지만, 개인화된 추천에 있어 상당한 과제를 제시합니다. 음악과 팟캐스트와 달리, 초기 유료로 제공되는 오디오북은 구매 전에 쉽게 훑어볼 수 없어 추천의 적절성이 더욱 중요해집니다. 또한, 기존 플랫폼에 새로운 콘텐츠 유형을 도입하는 것은 대부분의 사용자가 이 새로운 콘텐츠 유형에 익숙하지 않아 극도의 데이터 희소성 문제에 직면합니다. 마지막으로, 수백만 명의 사용자에게 콘텐츠를 추천하기 위해서는 모델이 빠르게 반응하고 확장 가능해야 합니다. 이러한 과제를 해결하기 위해 우리는 팟캐스트와 음악 사용자 선호도를 활용하고, 이질적 그래프 신경망(HGNN)과 투 타워(2T) 모델로 구성된 확장 가능한 추천 시스템인 2T-HGNN을 소개합니다. 이 새로운 접근 방식은 낮은 지연 시간과 복잡성을 보장하면서도 미묘한 아이템 관계를 발견합니다. 우리는 사용자를 HGNN 그래프에서 분리하고 혁신적인 다중 링크 이웃 샘플러를 제안합니다. 이러한 선택은 2T 구성 요소와 함께 HGNN 모델의 복잡성을 크게 줄입니다. 수백만 명의 사용자를 포함한 실증적 평가 결과, 개인화된 추천의 품질이 크게 개선되어 새로운 오디오북 시작률이 +46% 증가하고 스트리밍률이 +23% 상승했습니다. 흥미롭게도, 우리 모델의 영향은 오디오북을 넘어 팟캐스트와 같은 기존 제품에도 혜택을 미쳤습니다.
English
In the ever-evolving digital audio landscape, Spotify, well-known for its
music and talk content, has recently introduced audiobooks to its vast user
base. While promising, this move presents significant challenges for
personalized recommendations. Unlike music and podcasts, audiobooks, initially
available for a fee, cannot be easily skimmed before purchase, posing higher
stakes for the relevance of recommendations. Furthermore, introducing a new
content type into an existing platform confronts extreme data sparsity, as most
users are unfamiliar with this new content type. Lastly, recommending content
to millions of users requires the model to react fast and be scalable. To
address these challenges, we leverage podcast and music user preferences and
introduce 2T-HGNN, a scalable recommendation system comprising Heterogeneous
Graph Neural Networks (HGNNs) and a Two Tower (2T) model. This novel approach
uncovers nuanced item relationships while ensuring low latency and complexity.
We decouple users from the HGNN graph and propose an innovative multi-link
neighbor sampler. These choices, together with the 2T component, significantly
reduce the complexity of the HGNN model. Empirical evaluations involving
millions of users show significant improvement in the quality of personalized
recommendations, resulting in a +46% increase in new audiobooks start rate and
a +23% boost in streaming rates. Intriguingly, our model's impact extends
beyond audiobooks, benefiting established products like podcasts.