PrefPalette: Modellizzazione Personalizzata delle Preferenze con Attributi Latenti
PrefPalette: Personalized Preference Modeling with Latent Attributes
July 17, 2025
Autori: Shuyue Stella Li, Melanie Sclar, Hunter Lang, Ansong Ni, Jacqueline He, Puxin Xu, Andrew Cohen, Chan Young Park, Yulia Tsvetkov, Asli Celikyilmaz
cs.AI
Abstract
Personalizzare i sistemi di intelligenza artificiale richiede non solo la comprensione delle preferenze degli utenti, ma anche delle ragioni che le sottendono. Tuttavia, i modelli di preferenza attuali trattano tipicamente il giudizio umano come una scatola nera. Introduciamo PrefPalette, un framework che scompone le preferenze in dimensioni attributive e adatta la previsione delle preferenze ai valori distinti delle comunità sociali in modo interpretabile dall'uomo. PrefPalette opera un principio delle scienze cognitive noto come decisione multi-attributo in due modi: (1) un passaggio scalabile di sintesi attributiva controfattuale che prevede la generazione di dati di addestramento sintetici per isolare gli effetti dei singoli attributi (ad esempio, formalità, umorismo, valori culturali), e (2) una modellazione delle preferenze basata sull'attenzione che apprende come diverse comunità sociali ponderano dinamicamente questi attributi. Questo approccio va oltre la modellazione aggregata delle preferenze per catturare i diversi framework di valutazione che guidano il giudizio umano. Quando valutato su 45 comunità sociali della piattaforma online Reddit, PrefPalette supera GPT-4o del 46,6% in termini di accuratezza media di previsione. Oltre ai miglioramenti predittivi, PrefPalette ha anche evidenziato profili intuitivi e specifici per comunità: le comunità accademiche privilegiano la verbosità e la stimolazione, le comunità orientate al conflitto valorizzano il sarcasmo e la direttezza, e le comunità di supporto enfatizzano l'empatia. Modellando la struttura mediata dagli attributi del giudizio umano, PrefPalette offre sia una modellazione delle preferenze superiore sia intuizioni trasparenti e interpretabili, rappresentando un primo passo verso applicazioni personalizzate più affidabili e consapevoli dei valori.
English
Personalizing AI systems requires understanding not just what users prefer,
but the reasons that underlie those preferences - yet current preference models
typically treat human judgment as a black box. We introduce PrefPalette, a
framework that decomposes preferences into attribute dimensions and tailors its
preference prediction to distinct social community values in a
human-interpretable manner. PrefPalette operationalizes a cognitive science
principle known as multi-attribute decision making in two ways: (1) a scalable
counterfactual attribute synthesis step that involves generating synthetic
training data to isolate for individual attribute effects (e.g., formality,
humor, cultural values), and (2) attention-based preference modeling that
learns how different social communities dynamically weight these attributes.
This approach moves beyond aggregate preference modeling to capture the diverse
evaluation frameworks that drive human judgment. When evaluated on 45 social
communities from the online platform Reddit, PrefPalette outperforms GPT-4o by
46.6% in average prediction accuracy. Beyond raw predictive improvements,
PrefPalette also shed light on intuitive, community-specific profiles:
scholarly communities prioritize verbosity and stimulation, conflict-oriented
communities value sarcasm and directness, and support-based communities
emphasize empathy. By modeling the attribute-mediated structure of human
judgment, PrefPalette delivers both superior preference modeling and
transparent, interpretable insights, and serves as a first step toward more
trustworthy, value-aware personalized applications.