Interaktiver Empfehlungsagent mit aktiven Benutzerbefehlen

papers.abstract

Traditionelle Empfehlungssysteme stützen sich auf passive Feedback-Mechanismen, die Nutzer auf einfache Auswahlmöglichkeiten wie „Gefällt mir“ und „Gefällt mir nicht“ beschränken. Diese grobkörnigen Signale erfassen jedoch nicht die nuancenreichen Verhaltensmotive und Absichten der Nutzer. Folglich können aktuelle Systeme auch nicht unterscheiden, welche spezifischen Artikelattribute die Zufriedenheit oder Unzufriedenheit der Nutzer beeinflussen, was zu ungenauen Präferenzmodellen führt. Diese grundlegenden Einschränkungen schaffen eine anhaltende Lücke zwischen den Absichten der Nutzer und den Interpretationen des Systems, was letztendlich die Nutzerzufriedenheit beeinträchtigt und die Effektivität des Systems mindert. Um diese Einschränkungen zu überwinden, führen wir den Interactive Recommendation Feed (IRF) ein, ein bahnbrechendes Paradigma, das natürliche Sprachbefehle in gängigen Empfehlungsfeeds ermöglicht. Im Gegensatz zu traditionellen Systemen, die Nutzer auf passive, implizite Verhaltensbeeinflussung beschränken, ermöglicht IRF die aktive, explizite Kontrolle über Empfehlungsrichtlinien durch Echtzeit-Sprachbefehle. Um dieses Paradigma zu unterstützen, entwickeln wir RecBot, eine Dual-Agent-Architektur, bei der ein Parser-Agent sprachliche Ausdrücke in strukturierte Präferenzen umwandelt und ein Planner-Agent adaptive Werkzeugketten für die dynamische Anpassung der Richtlinien orchestriert. Um die praktische Implementierung zu ermöglichen, setzen wir simulationsgestützte Wissensdestillation ein, um eine effiziente Leistung bei gleichzeitiger Beibehaltung starker Argumentationsfähigkeiten zu erreichen. Durch umfangreiche Offline- und langfristige Online-Experimente zeigt RecBot signifikante Verbesserungen sowohl in der Nutzerzufriedenheit als auch in den geschäftlichen Ergebnissen.

English

Traditional recommender systems rely on passive feedback mechanisms that limit users to simple choices such as like and dislike. However, these coarse-grained signals fail to capture users' nuanced behavior motivations and intentions. In turn, current systems cannot also distinguish which specific item attributes drive user satisfaction or dissatisfaction, resulting in inaccurate preference modeling. These fundamental limitations create a persistent gap between user intentions and system interpretations, ultimately undermining user satisfaction and harming system effectiveness. To address these limitations, we introduce the Interactive Recommendation Feed (IRF), a pioneering paradigm that enables natural language commands within mainstream recommendation feeds. Unlike traditional systems that confine users to passive implicit behavioral influence, IRF empowers active explicit control over recommendation policies through real-time linguistic commands. To support this paradigm, we develop RecBot, a dual-agent architecture where a Parser Agent transforms linguistic expressions into structured preferences and a Planner Agent dynamically orchestrates adaptive tool chains for on-the-fly policy adjustment. To enable practical deployment, we employ simulation-augmented knowledge distillation to achieve efficient performance while maintaining strong reasoning capabilities. Through extensive offline and long-term online experiments, RecBot shows significant improvements in both user satisfaction and business outcomes.

Interaktiver Empfehlungsagent mit aktiven Benutzerbefehlen

Interactive Recommendation Agent with Active User Commands

papers.abstract

Support