Agente di Raccomandazione Interattivo con Comandi Attivi dell'Utente
Interactive Recommendation Agent with Active User Commands
September 25, 2025
Autori: Jiakai Tang, Yujie Luo, Xunke Xi, Fei Sun, Xueyang Feng, Sunhao Dai, Chao Yi, Dian Chen, Zhujin Gao, Yang Li, Xu Chen, Wen Chen, Jian Wu, Yuning Jiang, Bo Zheng
cs.AI
Abstract
I tradizionali sistemi di raccomandazione si basano su meccanismi di feedback passivi che limitano gli utenti a scelte semplici come "mi piace" e "non mi piace". Tuttavia, questi segnali a grana grossa non riescono a catturare le motivazioni e le intenzioni comportamentali sfumate degli utenti. Di conseguenza, i sistemi attuali non sono in grado di distinguere quali attributi specifici degli elementi determinano la soddisfazione o l'insoddisfazione dell'utente, portando a una modellazione imprecisa delle preferenze. Queste limitazioni fondamentali creano un divario persistente tra le intenzioni degli utenti e le interpretazioni del sistema, minando alla fine la soddisfazione degli utenti e compromettendo l'efficacia del sistema.
Per affrontare queste limitazioni, introduciamo l'Interactive Recommendation Feed (IRF), un paradigma pionieristico che consente comandi in linguaggio naturale all'interno dei feed di raccomandazione mainstream. A differenza dei sistemi tradizionali che confinano gli utenti a un'influenza comportamentale implicita e passiva, l'IRF conferisce un controllo esplicito e attivo sulle politiche di raccomandazione attraverso comandi linguistici in tempo reale. Per supportare questo paradigma, sviluppiamo RecBot, un'architettura a doppio agente in cui un Parser Agent trasforma le espressioni linguistiche in preferenze strutturate e un Planner Agent orchestra dinamicamente catene di strumenti adattativi per l'aggiustamento immediato delle politiche. Per consentire un'implementazione pratica, utilizziamo la distillazione della conoscenza aumentata dalla simulazione per ottenere prestazioni efficienti mantenendo forti capacità di ragionamento. Attraverso esperimenti offline estesi e online a lungo termine, RecBot mostra miglioramenti significativi sia nella soddisfazione degli utenti che nei risultati aziendali.
English
Traditional recommender systems rely on passive feedback mechanisms that
limit users to simple choices such as like and dislike. However, these
coarse-grained signals fail to capture users' nuanced behavior motivations and
intentions. In turn, current systems cannot also distinguish which specific
item attributes drive user satisfaction or dissatisfaction, resulting in
inaccurate preference modeling. These fundamental limitations create a
persistent gap between user intentions and system interpretations, ultimately
undermining user satisfaction and harming system effectiveness.
To address these limitations, we introduce the Interactive Recommendation
Feed (IRF), a pioneering paradigm that enables natural language commands within
mainstream recommendation feeds. Unlike traditional systems that confine users
to passive implicit behavioral influence, IRF empowers active explicit control
over recommendation policies through real-time linguistic commands. To support
this paradigm, we develop RecBot, a dual-agent architecture where a Parser
Agent transforms linguistic expressions into structured preferences and a
Planner Agent dynamically orchestrates adaptive tool chains for on-the-fly
policy adjustment. To enable practical deployment, we employ
simulation-augmented knowledge distillation to achieve efficient performance
while maintaining strong reasoning capabilities. Through extensive offline and
long-term online experiments, RecBot shows significant improvements in both
user satisfaction and business outcomes.