PrefPalette: Modelado de Preferencias Personalizadas con Atributos Latentes

Resumen

La personalización de sistemas de IA requiere comprender no solo las preferencias de los usuarios, sino también las razones subyacentes a esas preferencias; sin embargo, los modelos actuales de preferencias suelen tratar el juicio humano como una caja negra. Presentamos PrefPalette, un marco que descompone las preferencias en dimensiones de atributos y adapta su predicción de preferencias a los valores distintivos de diferentes comunidades sociales de manera interpretable para los humanos. PrefPalette opera bajo un principio de la ciencia cognitiva conocido como toma de decisiones multi-atributo de dos formas: (1) un paso escalable de síntesis de atributos contrafactuales que implica generar datos de entrenamiento sintéticos para aislar los efectos de atributos individuales (por ejemplo, formalidad, humor, valores culturales), y (2) un modelado de preferencias basado en atención que aprende cómo diferentes comunidades sociales ponderan dinámicamente estos atributos. Este enfoque va más allá del modelado agregado de preferencias para capturar los diversos marcos de evaluación que impulsan el juicio humano. Al evaluarse en 45 comunidades sociales de la plataforma en línea Reddit, PrefPalette supera a GPT-4o en un 46.6% en precisión promedio de predicción. Más allá de las mejoras predictivas, PrefPalette también reveló perfiles intuitivos específicos de cada comunidad: las comunidades académicas priorizan la verbosidad y la estimulación, las comunidades orientadas al conflicto valoran el sarcasmo y la franqueza, y las comunidades de apoyo enfatizan la empatía. Al modelar la estructura mediada por atributos del juicio humano, PrefPalette ofrece tanto un modelado superior de preferencias como insights transparentes e interpretables, y representa un primer paso hacia aplicaciones personalizadas más confiables y conscientes de los valores.

English

Personalizing AI systems requires understanding not just what users prefer, but the reasons that underlie those preferences - yet current preference models typically treat human judgment as a black box. We introduce PrefPalette, a framework that decomposes preferences into attribute dimensions and tailors its preference prediction to distinct social community values in a human-interpretable manner. PrefPalette operationalizes a cognitive science principle known as multi-attribute decision making in two ways: (1) a scalable counterfactual attribute synthesis step that involves generating synthetic training data to isolate for individual attribute effects (e.g., formality, humor, cultural values), and (2) attention-based preference modeling that learns how different social communities dynamically weight these attributes. This approach moves beyond aggregate preference modeling to capture the diverse evaluation frameworks that drive human judgment. When evaluated on 45 social communities from the online platform Reddit, PrefPalette outperforms GPT-4o by 46.6% in average prediction accuracy. Beyond raw predictive improvements, PrefPalette also shed light on intuitive, community-specific profiles: scholarly communities prioritize verbosity and stimulation, conflict-oriented communities value sarcasm and directness, and support-based communities emphasize empathy. By modeling the attribute-mediated structure of human judgment, PrefPalette delivers both superior preference modeling and transparent, interpretable insights, and serves as a first step toward more trustworthy, value-aware personalized applications.

PrefPalette: Modelado de Preferencias Personalizadas con Atributos Latentes

PrefPalette: Personalized Preference Modeling with Latent Attributes

Resumen

Support