長期的な協働のためのインタラクションを通じたユーザー嗜好の学習
Learning User Preferences Through Interaction for Long-Term Collaboration
January 6, 2026
著者: Shuhaib Mehri, Priyanka Kargupta, Tal August, Dilek Hakkani-Tür
cs.AI
要旨
対話エージェントがユーザーとの協働経験を蓄積するにつれ、ユーザー嗜好への適応は、長期的な関係構築と協働品質の持続的向上において不可欠である。本稿では、エージェントが複数セッションにわたりユーザー嗜好を学習し、それを活用して協働品質を高める能力を評価するベンチマーク、MultiSessionCollabを提案する。この環境で成功するエージェントを開発するため、インタラクション経験の蓄積に伴いユーザー嗜好を保持・洗練させるメモリを備えた長期的協働エージェントを提示する。さらに、MultiSessionCollab内のユーザーシミュレータの挙動から学習信号を導出し、エージェントがより包括的な振り返りを生成し、メモリをより効果的に更新するように訓練できることを実証する。大規模な実験により、エージェントにメモリを装備することが長期的協働を改善し、タスク成功率の向上、インタラクションの効率化、ユーザー負荷の低減をもたらすことを示す。最後に、メモリが実環境におけるユーザー体験の向上に寄与することを実証するため、実ユーザーによる評価を実施する。
English
As conversational agents accumulate experience collaborating with users, adapting to user preferences is essential for fostering long-term relationships and improving collaboration quality over time. We introduce MultiSessionCollab, a benchmark that evaluates how well agents can learn user preferences and leverage them to improve collaboration quality throughout multiple sessions. To develop agents that succeed in this setting, we present long-term collaborative agents equipped with a memory that persists and refines user preference as interaction experience accumulates. Moreover, we demonstrate that learning signals can be derived from user simulator behavior in MultiSessionCollab to train agents to generate more comprehensive reflections and update their memory more effectively. Extensive experiments show that equipping agents with memory improves long-term collaboration, yielding higher task success rates, more efficient interactions, and reduced user effort. Finally, we conduct a human user study that demonstrates that memory helps improve user experience in real-world settings.