Agente de Recomendación Interactivo con Comandos Activos del Usuario
Interactive Recommendation Agent with Active User Commands
September 25, 2025
Autores: Jiakai Tang, Yujie Luo, Xunke Xi, Fei Sun, Xueyang Feng, Sunhao Dai, Chao Yi, Dian Chen, Zhujin Gao, Yang Li, Xu Chen, Wen Chen, Jian Wu, Yuning Jiang, Bo Zheng
cs.AI
Resumen
Los sistemas de recomendación tradicionales dependen de mecanismos de retroalimentación pasiva que limitan a los usuarios a elecciones simples como "me gusta" y "no me gusta". Sin embargo, estas señales de grano grueso no logran capturar las motivaciones e intenciones matizadas del comportamiento de los usuarios. A su vez, los sistemas actuales tampoco pueden distinguir qué atributos específicos de los elementos impulsan la satisfacción o insatisfacción del usuario, lo que resulta en un modelado impreciso de las preferencias. Estas limitaciones fundamentales crean una brecha persistente entre las intenciones del usuario y las interpretaciones del sistema, lo que finalmente socava la satisfacción del usuario y perjudica la efectividad del sistema.
Para abordar estas limitaciones, presentamos el Feed de Recomendación Interactiva (IRF, por sus siglas en inglés), un paradigma pionero que permite comandos en lenguaje natural dentro de los feeds de recomendación convencionales. A diferencia de los sistemas tradicionales que confinan a los usuarios a una influencia conductual implícita y pasiva, el IRF otorga un control explícito y activo sobre las políticas de recomendación a través de comandos lingüísticos en tiempo real. Para respaldar este paradigma, desarrollamos RecBot, una arquitectura de doble agente en la que un Agente Analizador transforma expresiones lingüísticas en preferencias estructuradas y un Agente Planificador orquesta dinámicamente cadenas de herramientas adaptativas para el ajuste instantáneo de políticas. Para permitir una implementación práctica, empleamos la destilación de conocimiento aumentada con simulación para lograr un rendimiento eficiente mientras se mantienen capacidades de razonamiento sólidas. A través de extensos experimentos fuera de línea y en línea a largo plazo, RecBot muestra mejoras significativas tanto en la satisfacción del usuario como en los resultados comerciales.
English
Traditional recommender systems rely on passive feedback mechanisms that
limit users to simple choices such as like and dislike. However, these
coarse-grained signals fail to capture users' nuanced behavior motivations and
intentions. In turn, current systems cannot also distinguish which specific
item attributes drive user satisfaction or dissatisfaction, resulting in
inaccurate preference modeling. These fundamental limitations create a
persistent gap between user intentions and system interpretations, ultimately
undermining user satisfaction and harming system effectiveness.
To address these limitations, we introduce the Interactive Recommendation
Feed (IRF), a pioneering paradigm that enables natural language commands within
mainstream recommendation feeds. Unlike traditional systems that confine users
to passive implicit behavioral influence, IRF empowers active explicit control
over recommendation policies through real-time linguistic commands. To support
this paradigm, we develop RecBot, a dual-agent architecture where a Parser
Agent transforms linguistic expressions into structured preferences and a
Planner Agent dynamically orchestrates adaptive tool chains for on-the-fly
policy adjustment. To enable practical deployment, we employ
simulation-augmented knowledge distillation to achieve efficient performance
while maintaining strong reasoning capabilities. Through extensive offline and
long-term online experiments, RecBot shows significant improvements in both
user satisfaction and business outcomes.