ChatPaper.aiChatPaper

Interactieve Aanbevelingsagent met Actieve Gebruikerscommando's

Interactive Recommendation Agent with Active User Commands

September 25, 2025
Auteurs: Jiakai Tang, Yujie Luo, Xunke Xi, Fei Sun, Xueyang Feng, Sunhao Dai, Chao Yi, Dian Chen, Zhujin Gao, Yang Li, Xu Chen, Wen Chen, Jian Wu, Yuning Jiang, Bo Zheng
cs.AI

Samenvatting

Traditionele aanbevelingssystemen vertrouwen op passieve feedbackmechanismen die gebruikers beperken tot eenvoudige keuzes zoals 'leuk' en 'niet leuk'. Deze grove signalen slagen er echter niet in om de genuanceerde gedragsmotivaties en intenties van gebruikers vast te leggen. Hierdoor kunnen huidige systemen ook niet onderscheiden welke specifieke itemkenmerken gebruikers tevredenheid of ontevredenheid veroorzaken, wat leidt tot onnauwkeurige voorkeursmodellering. Deze fundamentele beperkingen creëren een hardnekkige kloof tussen gebruikersintenties en systeeminterpretaties, wat uiteindelijk de gebruikers tevredenheid ondermijnt en de effectiviteit van het systeem schaadt. Om deze beperkingen aan te pakken, introduceren we de Interactive Recommendation Feed (IRF), een baanbrekend paradigma dat natuurlijke taalcommando's mogelijk maakt binnen mainstream aanbevelingsfeeds. In tegenstelling tot traditionele systemen die gebruikers beperken tot passieve impliciete gedragsbeïnvloeding, geeft IRF gebruikers actieve expliciete controle over aanbevelingsbeleid via real-time linguïstische commando's. Om dit paradigma te ondersteunen, ontwikkelen we RecBot, een dual-agent architectuur waarin een Parser Agent linguïstische uitdrukkingen omzet in gestructureerde voorkeuren en een Planner Agent dynamisch adaptieve toolketens orkestreert voor on-the-fly beleidsaanpassing. Om praktische implementatie mogelijk te maken, gebruiken we simulatie-augmented knowledge distillation om efficiënte prestaties te bereiken terwijl sterke redeneercapaciteiten behouden blijven. Door uitgebreide offline en langdurige online experimenten toont RecBot significante verbeteringen in zowel gebruikers tevredenheid als zakelijke resultaten.
English
Traditional recommender systems rely on passive feedback mechanisms that limit users to simple choices such as like and dislike. However, these coarse-grained signals fail to capture users' nuanced behavior motivations and intentions. In turn, current systems cannot also distinguish which specific item attributes drive user satisfaction or dissatisfaction, resulting in inaccurate preference modeling. These fundamental limitations create a persistent gap between user intentions and system interpretations, ultimately undermining user satisfaction and harming system effectiveness. To address these limitations, we introduce the Interactive Recommendation Feed (IRF), a pioneering paradigm that enables natural language commands within mainstream recommendation feeds. Unlike traditional systems that confine users to passive implicit behavioral influence, IRF empowers active explicit control over recommendation policies through real-time linguistic commands. To support this paradigm, we develop RecBot, a dual-agent architecture where a Parser Agent transforms linguistic expressions into structured preferences and a Planner Agent dynamically orchestrates adaptive tool chains for on-the-fly policy adjustment. To enable practical deployment, we employ simulation-augmented knowledge distillation to achieve efficient performance while maintaining strong reasoning capabilities. Through extensive offline and long-term online experiments, RecBot shows significant improvements in both user satisfaction and business outcomes.
PDF52September 26, 2025