Интерактивный агент рекомендаций с активными командами пользователя
Interactive Recommendation Agent with Active User Commands
September 25, 2025
Авторы: Jiakai Tang, Yujie Luo, Xunke Xi, Fei Sun, Xueyang Feng, Sunhao Dai, Chao Yi, Dian Chen, Zhujin Gao, Yang Li, Xu Chen, Wen Chen, Jian Wu, Yuning Jiang, Bo Zheng
cs.AI
Аннотация
Традиционные системы рекомендаций полагаются на пассивные механизмы обратной связи, которые ограничивают пользователей простыми вариантами выбора, такими как "нравится" и "не нравится". Однако эти грубые сигналы не способны уловить тонкие мотивации и намерения пользователей. В свою очередь, современные системы также не могут определить, какие конкретные атрибуты элементов вызывают удовлетворение или неудовлетворение пользователей, что приводит к неточному моделированию предпочтений. Эти фундаментальные ограничения создают устойчивый разрыв между намерениями пользователей и интерпретациями системы, что в конечном итоге подрывает удовлетворенность пользователей и снижает эффективность системы.
Для преодоления этих ограничений мы представляем Interactive Recommendation Feed (IRF) — новаторскую парадигму, которая позволяет использовать команды на естественном языке в рамках основных потоков рекомендаций. В отличие от традиционных систем, которые ограничивают пользователей пассивным неявным влиянием на поведение, IRF предоставляет активный явный контроль над политиками рекомендаций через лингвистические команды в реальном времени. Для поддержки этой парадигмы мы разработали RecBot — архитектуру с двумя агентами, где Parser Agent преобразует лингвистические выражения в структурированные предпочтения, а Planner Agent динамически организует адаптивные цепочки инструментов для оперативной корректировки политик. Для обеспечения практического внедрения мы используем симуляционно-усиленное дистилляцию знаний, чтобы достичь эффективной производительности при сохранении мощных аналитических возможностей. В ходе обширных оффлайн- и долгосрочных онлайн-экспериментов RecBot демонстрирует значительные улучшения как в удовлетворенности пользователей, так и в бизнес-результатах.
English
Traditional recommender systems rely on passive feedback mechanisms that
limit users to simple choices such as like and dislike. However, these
coarse-grained signals fail to capture users' nuanced behavior motivations and
intentions. In turn, current systems cannot also distinguish which specific
item attributes drive user satisfaction or dissatisfaction, resulting in
inaccurate preference modeling. These fundamental limitations create a
persistent gap between user intentions and system interpretations, ultimately
undermining user satisfaction and harming system effectiveness.
To address these limitations, we introduce the Interactive Recommendation
Feed (IRF), a pioneering paradigm that enables natural language commands within
mainstream recommendation feeds. Unlike traditional systems that confine users
to passive implicit behavioral influence, IRF empowers active explicit control
over recommendation policies through real-time linguistic commands. To support
this paradigm, we develop RecBot, a dual-agent architecture where a Parser
Agent transforms linguistic expressions into structured preferences and a
Planner Agent dynamically orchestrates adaptive tool chains for on-the-fly
policy adjustment. To enable practical deployment, we employ
simulation-augmented knowledge distillation to achieve efficient performance
while maintaining strong reasoning capabilities. Through extensive offline and
long-term online experiments, RecBot shows significant improvements in both
user satisfaction and business outcomes.