Apprentissage des Préférences Utilisateur par l'Interaction pour une Collaboration à Long Terme
Learning User Preferences Through Interaction for Long-Term Collaboration
January 6, 2026
papers.authors: Shuhaib Mehri, Priyanka Kargupta, Tal August, Dilek Hakkani-Tür
cs.AI
papers.abstract
Au fur et à mesure que les agents conversationnels accumulent de l'expérience en collaborant avec les utilisateurs, l'adaptation aux préférences de ces derniers devient essentielle pour favoriser des relations à long terme et améliorer la qualité de la collaboration dans le temps. Nous présentons MultiSessionCollab, un benchmark qui évalue la capacité des agents à apprendre les préférences des utilisateurs et à les exploiter pour améliorer la qualité de la collaboration sur plusieurs sessions. Pour développer des agents performants dans ce contexte, nous proposons des agents collaboratifs à long terme équipés d'une mémoire qui conserve et affine les préférences de l'utilisateur à mesure que les expériences d'interaction s'accumulent. De plus, nous démontrons que des signaux d'apprentissage peuvent être dérivés du comportement d'un simulateur d'utilisateur dans MultiSessionCollab pour entraîner les agents à générer des réflexions plus complètes et à mettre à jour leur mémoire plus efficacement. Des expériences approfondies montrent qu'équiper les agents d'une mémoire améliore la collaboration à long terme, entraînant des taux de réussite de tâches plus élevés, des interactions plus efficaces et une réduction de l'effort utilisateur. Enfin, nous menons une étude avec des utilisateurs humains qui démontre que la mémoire contribue à améliorer l'expérience utilisateur dans des contextes réels.
English
As conversational agents accumulate experience collaborating with users, adapting to user preferences is essential for fostering long-term relationships and improving collaboration quality over time. We introduce MultiSessionCollab, a benchmark that evaluates how well agents can learn user preferences and leverage them to improve collaboration quality throughout multiple sessions. To develop agents that succeed in this setting, we present long-term collaborative agents equipped with a memory that persists and refines user preference as interaction experience accumulates. Moreover, we demonstrate that learning signals can be derived from user simulator behavior in MultiSessionCollab to train agents to generate more comprehensive reflections and update their memory more effectively. Extensive experiments show that equipping agents with memory improves long-term collaboration, yielding higher task success rates, more efficient interactions, and reduced user effort. Finally, we conduct a human user study that demonstrates that memory helps improve user experience in real-world settings.