beeFormer:レコメンダーシステムにおける意味と相互作用の類似性のギャップを埋める
beeFormer: Bridging the Gap Between Semantic and Interaction Similarity in Recommender Systems
September 16, 2024
著者: Vojtěch Vančura, Pavel Kordík, Milan Straka
cs.AI
要旨
レコメンダーシステムは、従来の協調フィルタリング手法が使用できないコールドスタートやゼロショットの推薦シナリオにおいて、予測を改善するためにしばしばテキスト側の情報を利用します。過去数年にわたり、レコメンダーシステム向けのテキストマイニング手法が多数提案されてきましたが、その中でも最も注目されているのが文のトランスフォーマーです。しかしながら、これらのモデルは、レコメンダーシステム固有の隠れたパターンとの相互作用データを活用せずに意味の類似性を予測するように訓練されています。本論文では、beeFormerという、相互作用データを用いて文のトランスフォーマーモデルを訓練するためのフレームワークを提案します。beeFormerで訓練されたモデルは、異なるデータセット間で知識を転送し、意味の類似性文のトランスフォーマーや従来の協調フィルタリング手法を上回る性能を示すことを示します。また、異なるドメインの複数のデータセットで訓練することで、1つのモデルに知識を蓄積することが可能となり、レコメンダーシステム向けのテキスト表現を探索するための汎用的でドメインに依存しない文のトランスフォーマーモデルを訓練する可能性を開くことができます。私たちは、実験の再現を可能にするソースコード、訓練済みモデル、および追加の詳細を公開しています。
English
Recommender systems often use text-side information to improve their
predictions, especially in cold-start or zero-shot recommendation scenarios,
where traditional collaborative filtering approaches cannot be used. Many
approaches to text-mining side information for recommender systems have been
proposed over recent years, with sentence Transformers being the most prominent
one. However, these models are trained to predict semantic similarity without
utilizing interaction data with hidden patterns specific to recommender
systems. In this paper, we propose beeFormer, a framework for training sentence
Transformer models with interaction data. We demonstrate that our models
trained with beeFormer can transfer knowledge between datasets while
outperforming not only semantic similarity sentence Transformers but also
traditional collaborative filtering methods. We also show that training on
multiple datasets from different domains accumulates knowledge in a single
model, unlocking the possibility of training universal, domain-agnostic
sentence Transformer models to mine text representations for recommender
systems. We release the source code, trained models, and additional details
allowing replication of our experiments at
https://github.com/recombee/beeformer.Summary
AI-Generated Summary