ChatPaper.aiChatPaper

VisualLens: Personalização através da História Visual

VisualLens: Personalization through Visual History

November 25, 2024
Autores: Wang Bill Zhu, Deqing Fu, Kai Sun, Yi Lu, Zhaojiang Lin, Seungwhan Moon, Kanika Narang, Mustafa Canim, Yue Liu, Anuj Kumar, Xin Luna Dong
cs.AI

Resumo

Hipothetizamos que o histórico visual de um usuário com imagens refletindo sua vida diária oferece insights valiosos sobre seus interesses e preferências, e pode ser aproveitado para personalização. Entre os muitos desafios para alcançar esse objetivo, o principal é a diversidade e ruídos no histórico visual, contendo imagens não necessariamente relacionadas a uma tarefa de recomendação, não refletindo necessariamente o interesse do usuário, ou até mesmo não sendo relevantes para preferências. Os sistemas de recomendação existentes geralmente se baseiam em registros de interação do usuário específicos da tarefa, como histórico de compras online para recomendações de compras, ou se concentram em sinais de texto. Propomos uma abordagem inovadora, VisualLens, que extrai, filtra e aprimora representações de imagens, e aproveita esses sinais para personalização. Criamos dois novos benchmarks com históricos visuais agnósticos à tarefa, e demonstramos que nosso método melhora em relação às recomendações de última geração em 5-10% no Hit@3, e supera o GPT-4o em 2-5%. Nossa abordagem abre caminho para recomendações personalizadas em cenários onde os métodos tradicionais falham.
English
We hypothesize that a user's visual history with images reflecting their daily life, offers valuable insights into their interests and preferences, and can be leveraged for personalization. Among the many challenges to achieve this goal, the foremost is the diversity and noises in the visual history, containing images not necessarily related to a recommendation task, not necessarily reflecting the user's interest, or even not necessarily preference-relevant. Existing recommendation systems either rely on task-specific user interaction logs, such as online shopping history for shopping recommendations, or focus on text signals. We propose a novel approach, VisualLens, that extracts, filters, and refines image representations, and leverages these signals for personalization. We created two new benchmarks with task-agnostic visual histories, and show that our method improves over state-of-the-art recommendations by 5-10% on Hit@3, and improves over GPT-4o by 2-5%. Our approach paves the way for personalized recommendations in scenarios where traditional methods fail.

Summary

AI-Generated Summary

PDF182November 26, 2024