PrefPalette: 잠재 속성을 활용한 개인 맞춤형 선호도 모델링
PrefPalette: Personalized Preference Modeling with Latent Attributes
July 17, 2025
저자: Shuyue Stella Li, Melanie Sclar, Hunter Lang, Ansong Ni, Jacqueline He, Puxin Xu, Andrew Cohen, Chan Young Park, Yulia Tsvetkov, Asli Celikyilmaz
cs.AI
초록
AI 시스템을 개인화하기 위해서는 사용자의 선호뿐만 아니라 그 선호를 이끄는 근본적인 이유를 이해해야 하지만, 현재의 선호 모델들은 일반적으로 인간의 판단을 블랙박스로 취급합니다. 우리는 PrefPalette를 소개합니다. 이 프레임워크는 선호를 속성 차원으로 분해하고, 인간이 이해할 수 있는 방식으로 각기 다른 사회 공동체의 가치에 맞춰 선호 예측을 조정합니다. PrefPalette는 다중 속성 의사결정이라는 인지과학 원리를 두 가지 방식으로 구현합니다: (1) 개별 속성 효과(예: 형식성, 유머, 문화적 가치)를 분리하기 위해 합성 훈련 데이터를 생성하는 확장 가능한 반사실적 속성 합성 단계, 그리고 (2) 다양한 사회 공동체가 이러한 속성을 동적으로 가중치를 부여하는 방식을 학습하는 주의 기반 선호 모델링. 이 접근법은 집계된 선호 모델링을 넘어 인간 판단을 이끄는 다양한 평가 프레임워크를 포착합니다. 온라인 플랫폼 Reddit의 45개 사회 공동체에서 평가한 결과, PrefPalette는 평균 예측 정확도에서 GPT-4o를 46.6% 앞섰습니다. 단순한 예측 성능 향상 이상으로, PrefPalette는 직관적이고 공동체 특화된 프로파일을 밝혀냈습니다: 학술적 공동체는 장황함과 자극을 우선시하고, 갈등 지향적 공동체는 비꼼과 직설성을 중요하게 여기며, 지원 기반 공동체는 공감을 강조합니다. 인간 판단의 속성 매개 구조를 모델링함으로써, PrefPalette는 우수한 선호 모델링과 투명하고 해석 가능한 통찰을 제공하며, 더 신뢰할 수 있고 가치를 인지한 개인화 애플리케이션을 위한 첫걸음을 내딛습니다.
English
Personalizing AI systems requires understanding not just what users prefer,
but the reasons that underlie those preferences - yet current preference models
typically treat human judgment as a black box. We introduce PrefPalette, a
framework that decomposes preferences into attribute dimensions and tailors its
preference prediction to distinct social community values in a
human-interpretable manner. PrefPalette operationalizes a cognitive science
principle known as multi-attribute decision making in two ways: (1) a scalable
counterfactual attribute synthesis step that involves generating synthetic
training data to isolate for individual attribute effects (e.g., formality,
humor, cultural values), and (2) attention-based preference modeling that
learns how different social communities dynamically weight these attributes.
This approach moves beyond aggregate preference modeling to capture the diverse
evaluation frameworks that drive human judgment. When evaluated on 45 social
communities from the online platform Reddit, PrefPalette outperforms GPT-4o by
46.6% in average prediction accuracy. Beyond raw predictive improvements,
PrefPalette also shed light on intuitive, community-specific profiles:
scholarly communities prioritize verbosity and stimulation, conflict-oriented
communities value sarcasm and directness, and support-based communities
emphasize empathy. By modeling the attribute-mediated structure of human
judgment, PrefPalette delivers both superior preference modeling and
transparent, interpretable insights, and serves as a first step toward more
trustworthy, value-aware personalized applications.