Agente de Recomendación Interactivo con Comandos Activos del Usuario

Resumen

Los sistemas de recomendación tradicionales dependen de mecanismos de retroalimentación pasiva que limitan a los usuarios a elecciones simples como "me gusta" y "no me gusta". Sin embargo, estas señales de grano grueso no logran capturar las motivaciones e intenciones matizadas del comportamiento de los usuarios. A su vez, los sistemas actuales tampoco pueden distinguir qué atributos específicos de los elementos impulsan la satisfacción o insatisfacción del usuario, lo que resulta en un modelado impreciso de las preferencias. Estas limitaciones fundamentales crean una brecha persistente entre las intenciones del usuario y las interpretaciones del sistema, lo que finalmente socava la satisfacción del usuario y perjudica la efectividad del sistema. Para abordar estas limitaciones, presentamos el Feed de Recomendación Interactiva (IRF, por sus siglas en inglés), un paradigma pionero que permite comandos en lenguaje natural dentro de los feeds de recomendación convencionales. A diferencia de los sistemas tradicionales que confinan a los usuarios a una influencia conductual implícita y pasiva, el IRF otorga un control explícito y activo sobre las políticas de recomendación a través de comandos lingüísticos en tiempo real. Para respaldar este paradigma, desarrollamos RecBot, una arquitectura de doble agente en la que un Agente Analizador transforma expresiones lingüísticas en preferencias estructuradas y un Agente Planificador orquesta dinámicamente cadenas de herramientas adaptativas para el ajuste instantáneo de políticas. Para permitir una implementación práctica, empleamos la destilación de conocimiento aumentada con simulación para lograr un rendimiento eficiente mientras se mantienen capacidades de razonamiento sólidas. A través de extensos experimentos fuera de línea y en línea a largo plazo, RecBot muestra mejoras significativas tanto en la satisfacción del usuario como en los resultados comerciales.

English

Traditional recommender systems rely on passive feedback mechanisms that limit users to simple choices such as like and dislike. However, these coarse-grained signals fail to capture users' nuanced behavior motivations and intentions. In turn, current systems cannot also distinguish which specific item attributes drive user satisfaction or dissatisfaction, resulting in inaccurate preference modeling. These fundamental limitations create a persistent gap between user intentions and system interpretations, ultimately undermining user satisfaction and harming system effectiveness. To address these limitations, we introduce the Interactive Recommendation Feed (IRF), a pioneering paradigm that enables natural language commands within mainstream recommendation feeds. Unlike traditional systems that confine users to passive implicit behavioral influence, IRF empowers active explicit control over recommendation policies through real-time linguistic commands. To support this paradigm, we develop RecBot, a dual-agent architecture where a Parser Agent transforms linguistic expressions into structured preferences and a Planner Agent dynamically orchestrates adaptive tool chains for on-the-fly policy adjustment. To enable practical deployment, we employ simulation-augmented knowledge distillation to achieve efficient performance while maintaining strong reasoning capabilities. Through extensive offline and long-term online experiments, RecBot shows significant improvements in both user satisfaction and business outcomes.

Agente de Recomendación Interactivo con Comandos Activos del Usuario

Interactive Recommendation Agent with Active User Commands

Resumen

Support