PrefPalette : Modélisation personnalisée des préférences avec attributs latents
PrefPalette: Personalized Preference Modeling with Latent Attributes
July 17, 2025
papers.authors: Shuyue Stella Li, Melanie Sclar, Hunter Lang, Ansong Ni, Jacqueline He, Puxin Xu, Andrew Cohen, Chan Young Park, Yulia Tsvetkov, Asli Celikyilmaz
cs.AI
papers.abstract
La personnalisation des systèmes d'IA nécessite de comprendre non seulement les préférences des utilisateurs, mais aussi les raisons sous-jacentes à ces préférences - pourtant, les modèles de préférences actuels traitent généralement le jugement humain comme une boîte noire. Nous présentons PrefPalette, un cadre qui décompose les préférences en dimensions d'attributs et adapte sa prédiction des préférences aux valeurs distinctes des communautés sociales de manière interprétable par l'homme. PrefPalette opérationnalise un principe des sciences cognitives connu sous le nom de prise de décision multi-attributs de deux manières : (1) une étape de synthèse d'attributs contrefactuels scalable qui implique la génération de données d'entraînement synthétiques pour isoler les effets des attributs individuels (par exemple, la formalité, l'humour, les valeurs culturelles), et (2) une modélisation des préférences basée sur l'attention qui apprend comment différentes communautés sociales pondèrent dynamiquement ces attributs. Cette approche va au-delà de la modélisation agrégée des préférences pour capturer les divers cadres d'évaluation qui guident le jugement humain. Lorsqu'elle est évaluée sur 45 communautés sociales de la plateforme en ligne Reddit, PrefPalette surpasse GPT-4o de 46,6 % en précision moyenne de prédiction. Au-delà des améliorations prédictives brutes, PrefPalette a également mis en lumière des profils intuitifs spécifiques aux communautés : les communautés académiques privilégient la verbosité et la stimulation, les communautés axées sur les conflits valorisent le sarcasme et la directivité, et les communautés de soutien mettent l'accent sur l'empathie. En modélisant la structure médiée par les attributs du jugement humain, PrefPalette offre à la fois une modélisation supérieure des préférences et des insights transparents et interprétables, et constitue une première étape vers des applications personnalisées plus fiables et conscientes des valeurs.
English
Personalizing AI systems requires understanding not just what users prefer,
but the reasons that underlie those preferences - yet current preference models
typically treat human judgment as a black box. We introduce PrefPalette, a
framework that decomposes preferences into attribute dimensions and tailors its
preference prediction to distinct social community values in a
human-interpretable manner. PrefPalette operationalizes a cognitive science
principle known as multi-attribute decision making in two ways: (1) a scalable
counterfactual attribute synthesis step that involves generating synthetic
training data to isolate for individual attribute effects (e.g., formality,
humor, cultural values), and (2) attention-based preference modeling that
learns how different social communities dynamically weight these attributes.
This approach moves beyond aggregate preference modeling to capture the diverse
evaluation frameworks that drive human judgment. When evaluated on 45 social
communities from the online platform Reddit, PrefPalette outperforms GPT-4o by
46.6% in average prediction accuracy. Beyond raw predictive improvements,
PrefPalette also shed light on intuitive, community-specific profiles:
scholarly communities prioritize verbosity and stimulation, conflict-oriented
communities value sarcasm and directness, and support-based communities
emphasize empathy. By modeling the attribute-mediated structure of human
judgment, PrefPalette delivers both superior preference modeling and
transparent, interpretable insights, and serves as a first step toward more
trustworthy, value-aware personalized applications.