PrefPalette: Modelagem Personalizada de Preferências com Atributos Latentes
PrefPalette: Personalized Preference Modeling with Latent Attributes
July 17, 2025
Autores: Shuyue Stella Li, Melanie Sclar, Hunter Lang, Ansong Ni, Jacqueline He, Puxin Xu, Andrew Cohen, Chan Young Park, Yulia Tsvetkov, Asli Celikyilmaz
cs.AI
Resumo
A personalização de sistemas de IA requer compreender não apenas as preferências dos usuários, mas também as razões subjacentes a essas preferências - no entanto, os modelos de preferência atuais geralmente tratam o julgamento humano como uma caixa preta. Apresentamos o PrefPalette, uma estrutura que decompõe as preferências em dimensões de atributos e adapta sua previsão de preferência aos valores distintos de comunidades sociais de maneira interpretável para humanos. O PrefPalette opera um princípio da ciência cognitiva conhecido como tomada de decisão multi-atributo de duas formas: (1) uma etapa escalável de síntese de atributos contrafactuais que envolve a geração de dados de treinamento sintéticos para isolar os efeitos de atributos individuais (por exemplo, formalidade, humor, valores culturais), e (2) modelagem de preferência baseada em atenção que aprende como diferentes comunidades sociais ponderam dinamicamente esses atributos. Essa abordagem vai além da modelagem agregada de preferências para capturar os diversos frameworks de avaliação que impulsionam o julgamento humano. Quando avaliado em 45 comunidades sociais da plataforma online Reddit, o PrefPalette superou o GPT-4o em 46,6% na precisão média de previsão. Além de melhorias preditivas brutas, o PrefPalette também revelou perfis intuitivos e específicos de cada comunidade: comunidades acadêmicas priorizam verbosidade e estímulo, comunidades orientadas a conflitos valorizam sarcasmo e diretividade, e comunidades de suporte enfatizam empatia. Ao modelar a estrutura mediada por atributos do julgamento humano, o PrefPalette oferece tanto uma modelagem superior de preferências quanto insights transparentes e interpretáveis, servindo como um primeiro passo em direção a aplicações personalizadas mais confiáveis e conscientes de valores.
English
Personalizing AI systems requires understanding not just what users prefer,
but the reasons that underlie those preferences - yet current preference models
typically treat human judgment as a black box. We introduce PrefPalette, a
framework that decomposes preferences into attribute dimensions and tailors its
preference prediction to distinct social community values in a
human-interpretable manner. PrefPalette operationalizes a cognitive science
principle known as multi-attribute decision making in two ways: (1) a scalable
counterfactual attribute synthesis step that involves generating synthetic
training data to isolate for individual attribute effects (e.g., formality,
humor, cultural values), and (2) attention-based preference modeling that
learns how different social communities dynamically weight these attributes.
This approach moves beyond aggregate preference modeling to capture the diverse
evaluation frameworks that drive human judgment. When evaluated on 45 social
communities from the online platform Reddit, PrefPalette outperforms GPT-4o by
46.6% in average prediction accuracy. Beyond raw predictive improvements,
PrefPalette also shed light on intuitive, community-specific profiles:
scholarly communities prioritize verbosity and stimulation, conflict-oriented
communities value sarcasm and directness, and support-based communities
emphasize empathy. By modeling the attribute-mediated structure of human
judgment, PrefPalette delivers both superior preference modeling and
transparent, interpretable insights, and serves as a first step toward more
trustworthy, value-aware personalized applications.