PrefPalette: Modelado de Preferencias Personalizadas con Atributos Latentes
PrefPalette: Personalized Preference Modeling with Latent Attributes
July 17, 2025
Autores: Shuyue Stella Li, Melanie Sclar, Hunter Lang, Ansong Ni, Jacqueline He, Puxin Xu, Andrew Cohen, Chan Young Park, Yulia Tsvetkov, Asli Celikyilmaz
cs.AI
Resumen
La personalización de sistemas de IA requiere comprender no solo las preferencias de los usuarios, sino también las razones subyacentes a esas preferencias; sin embargo, los modelos actuales de preferencias suelen tratar el juicio humano como una caja negra. Presentamos PrefPalette, un marco que descompone las preferencias en dimensiones de atributos y adapta su predicción de preferencias a los valores distintivos de diferentes comunidades sociales de manera interpretable para los humanos. PrefPalette opera bajo un principio de la ciencia cognitiva conocido como toma de decisiones multi-atributo de dos formas: (1) un paso escalable de síntesis de atributos contrafactuales que implica generar datos de entrenamiento sintéticos para aislar los efectos de atributos individuales (por ejemplo, formalidad, humor, valores culturales), y (2) un modelado de preferencias basado en atención que aprende cómo diferentes comunidades sociales ponderan dinámicamente estos atributos. Este enfoque va más allá del modelado agregado de preferencias para capturar los diversos marcos de evaluación que impulsan el juicio humano. Al evaluarse en 45 comunidades sociales de la plataforma en línea Reddit, PrefPalette supera a GPT-4o en un 46.6% en precisión promedio de predicción. Más allá de las mejoras predictivas, PrefPalette también reveló perfiles intuitivos específicos de cada comunidad: las comunidades académicas priorizan la verbosidad y la estimulación, las comunidades orientadas al conflicto valoran el sarcasmo y la franqueza, y las comunidades de apoyo enfatizan la empatía. Al modelar la estructura mediada por atributos del juicio humano, PrefPalette ofrece tanto un modelado superior de preferencias como insights transparentes e interpretables, y representa un primer paso hacia aplicaciones personalizadas más confiables y conscientes de los valores.
English
Personalizing AI systems requires understanding not just what users prefer,
but the reasons that underlie those preferences - yet current preference models
typically treat human judgment as a black box. We introduce PrefPalette, a
framework that decomposes preferences into attribute dimensions and tailors its
preference prediction to distinct social community values in a
human-interpretable manner. PrefPalette operationalizes a cognitive science
principle known as multi-attribute decision making in two ways: (1) a scalable
counterfactual attribute synthesis step that involves generating synthetic
training data to isolate for individual attribute effects (e.g., formality,
humor, cultural values), and (2) attention-based preference modeling that
learns how different social communities dynamically weight these attributes.
This approach moves beyond aggregate preference modeling to capture the diverse
evaluation frameworks that drive human judgment. When evaluated on 45 social
communities from the online platform Reddit, PrefPalette outperforms GPT-4o by
46.6% in average prediction accuracy. Beyond raw predictive improvements,
PrefPalette also shed light on intuitive, community-specific profiles:
scholarly communities prioritize verbosity and stimulation, conflict-oriented
communities value sarcasm and directness, and support-based communities
emphasize empathy. By modeling the attribute-mediated structure of human
judgment, PrefPalette delivers both superior preference modeling and
transparent, interpretable insights, and serves as a first step toward more
trustworthy, value-aware personalized applications.