Семантические идентификаторы для совместного генеративного поиска и рекомендаций
Semantic IDs for Joint Generative Search and Recommendation
August 14, 2025
Авторы: Gustavo Penha, Edoardo D'Amico, Marco De Nadai, Enrico Palumbo, Alexandre Tamborrino, Ali Vardasbi, Max Lefarov, Shawn Lin, Timothy Heath, Francesco Fabbri, Hugues Bouchard
cs.AI
Аннотация
Генеративные модели, основанные на крупных языковых моделях (LLM), становятся универсальным решением для задач рекомендаций и поиска. Ключевым аспектом в проектировании таких моделей является выбор способа представления элементов: традиционно через уникальные идентификаторы (ID) и, в последнее время, с использованием семантических идентификаторов (Semantic IDs), состоящих из дискретных кодов, полученных из эмбеддингов. Хотя специализированные модели эмбеддингов могут улучшать производительность для отдельных задач, они могут плохо обобщаться в совместных сценариях. В данной работе мы исследуем, как создавать семантические идентификаторы, которые эффективно работают как в поиске, так и в рекомендациях при использовании унифицированной модели. Мы сравниваем различные стратегии построения семантических идентификаторов, рассматривая как специализированные, так и кросс-задачные подходы, а также вопрос о том, должна ли каждая задача иметь свои собственные токены семантических идентификаторов в рамках совместной генеративной модели для поиска и рекомендаций. Наши результаты показывают, что использование би-энкодерной модели, дообученной на задачах поиска и рекомендаций для получения эмбеддингов элементов, с последующим созданием унифицированного пространства семантических идентификаторов, обеспечивает эффективный компромисс, позволяющий достичь высокой производительности в обеих задачах. Мы надеемся, что эти результаты вдохновят дальнейшие исследования в области обобщаемых, семантически обоснованных схем идентификации и помогут в разработке следующего поколения унифицированных генеративных архитектур для рекомендательных систем.
English
Generative models powered by Large Language Models (LLMs) are emerging as a
unified solution for powering both recommendation and search tasks. A key
design choice in these models is how to represent items, traditionally through
unique identifiers (IDs) and more recently with Semantic IDs composed of
discrete codes, obtained from embeddings. While task-specific embedding models
can improve performance for individual tasks, they may not generalize well in a
joint setting. In this paper, we explore how to construct Semantic IDs that
perform well both in search and recommendation when using a unified model. We
compare a range of strategies to construct Semantic IDs, looking into
task-specific and cross-tasks approaches, and also whether each task should
have its own semantic ID tokens in a joint search and recommendation generative
model. Our results show that using a bi-encoder model fine-tuned on both search
and recommendation tasks to obtain item embeddings, followed by the
construction of a unified Semantic ID space provides an effective trade-off,
enabling strong performance in both tasks. We hope these findings spark
follow-up work on generalisable, semantically grounded ID schemes and inform
the next wave of unified generative recommender architectures.