ChatPaper.aiChatPaper

VisualLens: Personalisatie door Visuele Geschiedenis

VisualLens: Personalization through Visual History

November 25, 2024
Auteurs: Wang Bill Zhu, Deqing Fu, Kai Sun, Yi Lu, Zhaojiang Lin, Seungwhan Moon, Kanika Narang, Mustafa Canim, Yue Liu, Anuj Kumar, Xin Luna Dong
cs.AI

Samenvatting

Wij veronderstellen dat de visuele geschiedenis van een gebruiker met afbeeldingen die hun dagelijks leven weerspiegelen, waardevolle inzichten biedt in hun interesses en voorkeuren, en kan worden benut voor personalisatie. Onder de vele uitdagingen om dit doel te bereiken, is de belangrijkste de diversiteit en ruis in de visuele geschiedenis, met afbeeldingen die niet noodzakelijkerwijs verband houden met een aanbevelingstaak, niet noodzakelijkerwijs de interesse van de gebruiker weerspiegelen, of zelfs niet noodzakelijkerwijs relevant zijn voor voorkeuren. Bestaande aanbevelingssystemen vertrouwen ofwel op taakspecifieke gebruikersinteractielogs, zoals online winkelgeschiedenis voor winkelaanbevelingen, of richten zich op tekstsignalen. Wij stellen een nieuw benadering voor, VisualLens, die beeldrepresentaties extraheren, filteren en verfijnen, en deze signalen benutten voor personalisatie. We hebben twee nieuwe benchmarks gecreëerd met taakagnostische visuele geschiedenissen, en laten zien dat onze methode de state-of-the-art aanbevelingen verbetert met 5-10% op Hit@3, en beter presteert dan GPT-4o met 2-5%. Onze benadering effent het pad voor gepersonaliseerde aanbevelingen in scenario's waar traditionele methoden tekortschieten.
English
We hypothesize that a user's visual history with images reflecting their daily life, offers valuable insights into their interests and preferences, and can be leveraged for personalization. Among the many challenges to achieve this goal, the foremost is the diversity and noises in the visual history, containing images not necessarily related to a recommendation task, not necessarily reflecting the user's interest, or even not necessarily preference-relevant. Existing recommendation systems either rely on task-specific user interaction logs, such as online shopping history for shopping recommendations, or focus on text signals. We propose a novel approach, VisualLens, that extracts, filters, and refines image representations, and leverages these signals for personalization. We created two new benchmarks with task-agnostic visual histories, and show that our method improves over state-of-the-art recommendations by 5-10% on Hit@3, and improves over GPT-4o by 2-5%. Our approach paves the way for personalized recommendations in scenarios where traditional methods fail.

Summary

AI-Generated Summary

PDF182November 26, 2024