Изучение предпочтений пользователя через взаимодействие для долгосрочного сотрудничества
Learning User Preferences Through Interaction for Long-Term Collaboration
January 6, 2026
Авторы: Shuhaib Mehri, Priyanka Kargupta, Tal August, Dilek Hakkani-Tür
cs.AI
Аннотация
По мере накопления опыта взаимодействия с пользователями адаптация к их предпочтениям становится ключевым фактором для построения долгосрочных отношений и повышения качества коллаборации. Мы представляем MultiSessionCollab — бенчмарк, который оценивает способность агентов изучать предпочтения пользователей и эффективно использовать их для улучшения совместной работы в ходе множества сессий. Для создания успешных агентов в этой среде мы предлагаем долгосрочные коллаборативные агенты, оснащённые памятью, которая сохраняет и уточняет пользовательские предпочтения по мере накопления опыта взаимодействия. Кроме того, мы показываем, что из поведения пользовательского симулятора в MultiSessionCollab можно извлекать обучающие сигналы для тренировки агентов с целью генерации более содержательных рефлексий и более эффективного обновления памяти. Масштабные эксперименты демонстрируют, что оснащение агентов памятью улучшает долгосрочное сотрудничество, повышая процент успешного выполнения задач, сокращая количество взаимодействий и уменьшая усилия пользователя. Наконец, мы проводим исследование с участием реальных пользователей, которое подтверждает, что память способствует улучшению пользовательского опыта в реальных условиях.
English
As conversational agents accumulate experience collaborating with users, adapting to user preferences is essential for fostering long-term relationships and improving collaboration quality over time. We introduce MultiSessionCollab, a benchmark that evaluates how well agents can learn user preferences and leverage them to improve collaboration quality throughout multiple sessions. To develop agents that succeed in this setting, we present long-term collaborative agents equipped with a memory that persists and refines user preference as interaction experience accumulates. Moreover, we demonstrate that learning signals can be derived from user simulator behavior in MultiSessionCollab to train agents to generate more comprehensive reflections and update their memory more effectively. Extensive experiments show that equipping agents with memory improves long-term collaboration, yielding higher task success rates, more efficient interactions, and reduced user effort. Finally, we conduct a human user study that demonstrates that memory helps improve user experience in real-world settings.