Identité Culturelle Présumée : Comment les Noms Influencent les Réponses des Modèles de Langage
Presumed Cultural Identity: How Names Shape LLM Responses
February 17, 2025
Auteurs: Siddhesh Pawar, Arnav Arora, Lucie-Aimée Kaffee, Isabelle Augenstein
cs.AI
Résumé
Les noms sont profondément liés à l'identité humaine. Ils peuvent servir de marqueurs d'individualité, de patrimoine culturel et d'histoire personnelle. Cependant, utiliser les noms comme indicateur central de l'identité peut conduire à une simplification excessive d'identités complexes. Lors des interactions avec les LLM (modèles de langage de grande taille), les noms d'utilisateurs constituent un point d'information important pour la personnalisation. Les noms peuvent apparaître dans les conversations avec les chatbots via une saisie directe de l'utilisateur (demandée par les chatbots), dans des contextes de tâches comme la révision de CV, ou comme fonctionnalités de mémoire intégrées qui stockent les informations utilisateur pour la personnalisation. Nous étudions les biais associés aux noms en mesurant les présomptions culturelles dans les réponses générées par les LLM face à des requêtes courantes de recherche de suggestions, qui pourraient impliquer des suppositions sur l'utilisateur. Nos analyses révèlent de fortes hypothèses sur l'identité culturelle associée aux noms dans les générations des LLM, à travers plusieurs cultures. Notre travail a des implications pour la conception de systèmes de personnalisation plus nuancés, évitant de renforcer les stéréotypes tout en maintenant une personnalisation significative.
English
Names are deeply tied to human identity. They can serve as markers of
individuality, cultural heritage, and personal history. However, using names as
a core indicator of identity can lead to over-simplification of complex
identities. When interacting with LLMs, user names are an important point of
information for personalisation. Names can enter chatbot conversations through
direct user input (requested by chatbots), as part of task contexts such as CV
reviews, or as built-in memory features that store user information for
personalisation. We study biases associated with names by measuring cultural
presumptions in the responses generated by LLMs when presented with common
suggestion-seeking queries, which might involve making assumptions about the
user. Our analyses demonstrate strong assumptions about cultural identity
associated with names present in LLM generations across multiple cultures. Our
work has implications for designing more nuanced personalisation systems that
avoid reinforcing stereotypes while maintaining meaningful customisation.Summary
AI-Generated Summary