PrefPalette: Персонализированное моделирование предпочтений с использованием латентных атрибутов
PrefPalette: Personalized Preference Modeling with Latent Attributes
July 17, 2025
Авторы: Shuyue Stella Li, Melanie Sclar, Hunter Lang, Ansong Ni, Jacqueline He, Puxin Xu, Andrew Cohen, Chan Young Park, Yulia Tsvetkov, Asli Celikyilmaz
cs.AI
Аннотация
Персонализация систем искусственного интеллекта требует понимания не только того, что предпочитают пользователи, но и причин, лежащих в основе этих предпочтений. Однако современные модели предпочтений обычно рассматривают человеческое суждение как "черный ящик". Мы представляем PrefPalette — фреймворк, который декомпозирует предпочтения на атрибутивные измерения и адаптирует прогнозирование предпочтений к ценностям различных социальных сообществ в интерпретируемом для человека виде. PrefPalette реализует принцип когнитивной науки, известный как многокритериальное принятие решений, двумя способами: (1) масштабируемый этап синтеза контрфактуальных атрибутов, который включает генерацию синтетических обучающих данных для изоляции эффектов отдельных атрибутов (например, формальность, юмор, культурные ценности), и (2) моделирование предпочтений на основе механизма внимания, которое изучает, как различные социальные сообщества динамически взвешивают эти атрибуты. Этот подход выходит за рамки агрегированного моделирования предпочтений, чтобы уловить разнообразные оценочные рамки, лежащие в основе человеческого суждения. При оценке на 45 социальных сообществах с онлайн-платформы Reddit PrefPalette превосходит GPT-4o на 46,6% по средней точности прогнозирования. Помимо улучшения прогнозов, PrefPalette также выявляет интуитивные, специфичные для сообществ профили: научные сообщества ценят многословность и стимуляцию, конфликтно-ориентированные сообщества предпочитают сарказм и прямолинейность, а поддерживающие сообщества делают акцент на эмпатии. Моделируя атрибутивно-опосредованную структуру человеческого суждения, PrefPalette обеспечивает как превосходное моделирование предпочтений, так и прозрачные, интерпретируемые инсайты, делая первый шаг к созданию более надежных и учитывающих ценности персонализированных приложений.
English
Personalizing AI systems requires understanding not just what users prefer,
but the reasons that underlie those preferences - yet current preference models
typically treat human judgment as a black box. We introduce PrefPalette, a
framework that decomposes preferences into attribute dimensions and tailors its
preference prediction to distinct social community values in a
human-interpretable manner. PrefPalette operationalizes a cognitive science
principle known as multi-attribute decision making in two ways: (1) a scalable
counterfactual attribute synthesis step that involves generating synthetic
training data to isolate for individual attribute effects (e.g., formality,
humor, cultural values), and (2) attention-based preference modeling that
learns how different social communities dynamically weight these attributes.
This approach moves beyond aggregate preference modeling to capture the diverse
evaluation frameworks that drive human judgment. When evaluated on 45 social
communities from the online platform Reddit, PrefPalette outperforms GPT-4o by
46.6% in average prediction accuracy. Beyond raw predictive improvements,
PrefPalette also shed light on intuitive, community-specific profiles:
scholarly communities prioritize verbosity and stimulation, conflict-oriented
communities value sarcasm and directness, and support-based communities
emphasize empathy. By modeling the attribute-mediated structure of human
judgment, PrefPalette delivers both superior preference modeling and
transparent, interpretable insights, and serves as a first step toward more
trustworthy, value-aware personalized applications.