ChatPaper.aiChatPaper

De Personalisatieval: Hoe Gebruikersgeheugen Emotioneel Redeneren in LLM's Verandert

The Personalization Trap: How User Memory Alters Emotional Reasoning in LLMs

October 10, 2025
Auteurs: Xi Fang, Weijie Xu, Yuchong Zhang, Stephanie Eckman, Scott Nickleach, Chandan K. Reddy
cs.AI

Samenvatting

Wanneer een AI-assistent zich herinnert dat Sarah een alleenstaande moeder is met twee banen, interpreteert het haar stress dan anders dan wanneer ze een welgestelde topmanager zou zijn? Naarmate gepersonaliseerde AI-systemen steeds vaker langetermijngebruikersgeheugen integreren, is het cruciaal om te begrijpen hoe dit geheugen emotioneel redeneren beïnvloedt. Wij onderzoeken hoe gebruikersgeheugen de emotionele intelligentie van grote taalmodelen (LLM's) beïnvloedt door 15 modellen te evalueren op door mensen gevalideerde emotionele intelligentietests. We ontdekken dat identieke scenario’s gekoppeld aan verschillende gebruikersprofielen systematisch uiteenlopende emotionele interpretaties opleveren. In gevalideerde, gebruikersonafhankelijke emotionele scenario’s en diverse gebruikersprofielen kwamen systematische vooroordelen naar voren in verschillende hoogpresterende LLM's, waarbij bevoorrechte profielen nauwkeurigere emotionele interpretaties kregen. Bovendien tonen LLM's aanzienlijke verschillen in emotiebegrip en ondersteunende aanbevelingen bij taken, wat aangeeft dat personalisatiemechanismen sociale hiërarchieën kunnen inbedden in het emotionele redeneren van modellen. Deze resultaten benadrukken een belangrijke uitdaging voor AI met geheugenversterking: systemen die zijn ontworpen voor personalisatie kunnen onbedoeld sociale ongelijkheden versterken.
English
When an AI assistant remembers that Sarah is a single mother working two jobs, does it interpret her stress differently than if she were a wealthy executive? As personalized AI systems increasingly incorporate long-term user memory, understanding how this memory shapes emotional reasoning is critical. We investigate how user memory affects emotional intelligence in large language models (LLMs) by evaluating 15 models on human validated emotional intelligence tests. We find that identical scenarios paired with different user profiles produce systematically divergent emotional interpretations. Across validated user independent emotional scenarios and diverse user profiles, systematic biases emerged in several high-performing LLMs where advantaged profiles received more accurate emotional interpretations. Moreover, LLMs demonstrate significant disparities across demographic factors in emotion understanding and supportive recommendations tasks, indicating that personalization mechanisms can embed social hierarchies into models emotional reasoning. These results highlight a key challenge for memory enhanced AI: systems designed for personalization may inadvertently reinforce social inequalities.
PDF64October 14, 2025