LiRank: Промышленные модели ранжирования крупного масштаба в LinkedIn

Аннотация

Мы представляем LiRank, масштабируемую систему ранжирования в LinkedIn, которая внедряет в производство передовые архитектуры моделей и методы оптимизации. Мы раскрываем несколько улучшений в моделировании, включая Residual DCN, который добавляет механизмы внимания и остаточные соединения к известной архитектуре DCNv2. Мы делимся инсайтами по комбинированию и настройке современных архитектур для создания унифицированной модели, включая Dense Gating, Transformers и Residual DCN. Также мы предлагаем новые методы калибровки и описываем, как мы внедрили в производство методы исследования/эксплуатации на основе глубокого обучения. Для обеспечения эффективного обслуживания крупных моделей ранжирования в производственных условиях мы подробно рассказываем, как обучать и сжимать модели с использованием квантования и сжатия словаря. Мы предоставляем детали о настройке развертывания для масштабных сценариев использования, таких как ранжирование ленты, рекомендации вакансий и прогнозирование кликабельности рекламы (CTR). Мы обобщаем наши выводы из различных A/B-тестов, выделяя наиболее эффективные технические подходы. Эти идеи способствовали улучшению ключевых метрик во всех направлениях в LinkedIn: +0,5% сессий пользователей в ленте, +1,76% квалифицированных откликов на вакансии в поиске и рекомендациях, а также +4,3% для CTR рекламы. Мы надеемся, что эта работа предоставит практические инсайты и решения для специалистов, заинтересованных в использовании масштабируемых систем глубокого ранжирования.

English

We present LiRank, a large-scale ranking framework at LinkedIn that brings to production state-of-the-art modeling architectures and optimization methods. We unveil several modeling improvements, including Residual DCN, which adds attention and residual connections to the famous DCNv2 architecture. We share insights into combining and tuning SOTA architectures to create a unified model, including Dense Gating, Transformers and Residual DCN. We also propose novel techniques for calibration and describe how we productionalized deep learning based explore/exploit methods. To enable effective, production-grade serving of large ranking models, we detail how to train and compress models using quantization and vocabulary compression. We provide details about the deployment setup for large-scale use cases of Feed ranking, Jobs Recommendations, and Ads click-through rate (CTR) prediction. We summarize our learnings from various A/B tests by elucidating the most effective technical approaches. These ideas have contributed to relative metrics improvements across the board at LinkedIn: +0.5% member sessions in the Feed, +1.76% qualified job applications for Jobs search and recommendations, and +4.3% for Ads CTR. We hope this work can provide practical insights and solutions for practitioners interested in leveraging large-scale deep ranking systems.

LiRank: Промышленные модели ранжирования крупного масштаба в LinkedIn

LiRank: Industrial Large Scale Ranking Models at LinkedIn

Аннотация

Support