Agent de Recommandation Interactive avec Commandes Utilisateur Actives
Interactive Recommendation Agent with Active User Commands
September 25, 2025
papers.authors: Jiakai Tang, Yujie Luo, Xunke Xi, Fei Sun, Xueyang Feng, Sunhao Dai, Chao Yi, Dian Chen, Zhujin Gao, Yang Li, Xu Chen, Wen Chen, Jian Wu, Yuning Jiang, Bo Zheng
cs.AI
papers.abstract
Les systèmes de recommandation traditionnels s'appuient sur des mécanismes de feedback passifs qui limitent les utilisateurs à des choix simples tels que "j'aime" et "je n'aime pas". Cependant, ces signaux à granularité grossière ne parviennent pas à capturer les motivations et intentions nuancées des utilisateurs. Par conséquent, les systèmes actuels ne peuvent pas non plus distinguer quels attributs spécifiques des éléments influencent la satisfaction ou l'insatisfaction des utilisateurs, ce qui entraîne une modélisation imprécise des préférences. Ces limitations fondamentales créent un écart persistant entre les intentions des utilisateurs et les interprétations du système, compromettant finalement la satisfaction des utilisateurs et l'efficacité du système.
Pour remédier à ces limitations, nous introduisons le Flux de Recommandation Interactive (IRF), un paradigme novateur qui permet l'utilisation de commandes en langage naturel au sein des flux de recommandation grand public. Contrairement aux systèmes traditionnels qui confinent les utilisateurs à une influence comportementale implicite passive, l'IRF offre un contrôle explicite actif sur les politiques de recommandation grâce à des commandes linguistiques en temps réel. Pour soutenir ce paradigme, nous développons RecBot, une architecture à double agent où un Agent Parseur transforme les expressions linguistiques en préférences structurées et un Agent Planificateur orchestre dynamiquement des chaînes d'outils adaptatives pour ajuster les politiques à la volée. Pour permettre un déploiement pratique, nous utilisons une distillation de connaissances augmentée par simulation afin d'atteindre des performances efficaces tout en maintenant de solides capacités de raisonnement. À travers des expériences approfondies hors ligne et en ligne à long terme, RecBot démontre des améliorations significatives à la fois en termes de satisfaction des utilisateurs et de résultats commerciaux.
English
Traditional recommender systems rely on passive feedback mechanisms that
limit users to simple choices such as like and dislike. However, these
coarse-grained signals fail to capture users' nuanced behavior motivations and
intentions. In turn, current systems cannot also distinguish which specific
item attributes drive user satisfaction or dissatisfaction, resulting in
inaccurate preference modeling. These fundamental limitations create a
persistent gap between user intentions and system interpretations, ultimately
undermining user satisfaction and harming system effectiveness.
To address these limitations, we introduce the Interactive Recommendation
Feed (IRF), a pioneering paradigm that enables natural language commands within
mainstream recommendation feeds. Unlike traditional systems that confine users
to passive implicit behavioral influence, IRF empowers active explicit control
over recommendation policies through real-time linguistic commands. To support
this paradigm, we develop RecBot, a dual-agent architecture where a Parser
Agent transforms linguistic expressions into structured preferences and a
Planner Agent dynamically orchestrates adaptive tool chains for on-the-fly
policy adjustment. To enable practical deployment, we employ
simulation-augmented knowledge distillation to achieve efficient performance
while maintaining strong reasoning capabilities. Through extensive offline and
long-term online experiments, RecBot shows significant improvements in both
user satisfaction and business outcomes.