Interaktiver Empfehlungsagent mit aktiven Benutzerbefehlen
Interactive Recommendation Agent with Active User Commands
September 25, 2025
papers.authors: Jiakai Tang, Yujie Luo, Xunke Xi, Fei Sun, Xueyang Feng, Sunhao Dai, Chao Yi, Dian Chen, Zhujin Gao, Yang Li, Xu Chen, Wen Chen, Jian Wu, Yuning Jiang, Bo Zheng
cs.AI
papers.abstract
Traditionelle Empfehlungssysteme stützen sich auf passive Feedback-Mechanismen, die Nutzer auf einfache Auswahlmöglichkeiten wie „Gefällt mir“ und „Gefällt mir nicht“ beschränken. Diese grobkörnigen Signale erfassen jedoch nicht die nuancenreichen Verhaltensmotive und Absichten der Nutzer. Folglich können aktuelle Systeme auch nicht unterscheiden, welche spezifischen Artikelattribute die Zufriedenheit oder Unzufriedenheit der Nutzer beeinflussen, was zu ungenauen Präferenzmodellen führt. Diese grundlegenden Einschränkungen schaffen eine anhaltende Lücke zwischen den Absichten der Nutzer und den Interpretationen des Systems, was letztendlich die Nutzerzufriedenheit beeinträchtigt und die Effektivität des Systems mindert.
Um diese Einschränkungen zu überwinden, führen wir den Interactive Recommendation Feed (IRF) ein, ein bahnbrechendes Paradigma, das natürliche Sprachbefehle in gängigen Empfehlungsfeeds ermöglicht. Im Gegensatz zu traditionellen Systemen, die Nutzer auf passive, implizite Verhaltensbeeinflussung beschränken, ermöglicht IRF die aktive, explizite Kontrolle über Empfehlungsrichtlinien durch Echtzeit-Sprachbefehle. Um dieses Paradigma zu unterstützen, entwickeln wir RecBot, eine Dual-Agent-Architektur, bei der ein Parser-Agent sprachliche Ausdrücke in strukturierte Präferenzen umwandelt und ein Planner-Agent adaptive Werkzeugketten für die dynamische Anpassung der Richtlinien orchestriert. Um die praktische Implementierung zu ermöglichen, setzen wir simulationsgestützte Wissensdestillation ein, um eine effiziente Leistung bei gleichzeitiger Beibehaltung starker Argumentationsfähigkeiten zu erreichen. Durch umfangreiche Offline- und langfristige Online-Experimente zeigt RecBot signifikante Verbesserungen sowohl in der Nutzerzufriedenheit als auch in den geschäftlichen Ergebnissen.
English
Traditional recommender systems rely on passive feedback mechanisms that
limit users to simple choices such as like and dislike. However, these
coarse-grained signals fail to capture users' nuanced behavior motivations and
intentions. In turn, current systems cannot also distinguish which specific
item attributes drive user satisfaction or dissatisfaction, resulting in
inaccurate preference modeling. These fundamental limitations create a
persistent gap between user intentions and system interpretations, ultimately
undermining user satisfaction and harming system effectiveness.
To address these limitations, we introduce the Interactive Recommendation
Feed (IRF), a pioneering paradigm that enables natural language commands within
mainstream recommendation feeds. Unlike traditional systems that confine users
to passive implicit behavioral influence, IRF empowers active explicit control
over recommendation policies through real-time linguistic commands. To support
this paradigm, we develop RecBot, a dual-agent architecture where a Parser
Agent transforms linguistic expressions into structured preferences and a
Planner Agent dynamically orchestrates adaptive tool chains for on-the-fly
policy adjustment. To enable practical deployment, we employ
simulation-augmented knowledge distillation to achieve efficient performance
while maintaining strong reasoning capabilities. Through extensive offline and
long-term online experiments, RecBot shows significant improvements in both
user satisfaction and business outcomes.