Identidade Cultural Presumida: Como os Nomes Moldam as Respostas de Modelos de Linguagem
Presumed Cultural Identity: How Names Shape LLM Responses
February 17, 2025
Autores: Siddhesh Pawar, Arnav Arora, Lucie-Aimée Kaffee, Isabelle Augenstein
cs.AI
Resumo
Os nomes estão profundamente ligados à identidade humana. Eles podem servir como marcadores de individualidade, herança cultural e história pessoal. No entanto, usar nomes como um indicador central de identidade pode levar a uma simplificação excessiva de identidades complexas. Ao interagir com LLMs (Modelos de Linguagem de Grande Escala), os nomes dos usuários são um ponto importante de informação para personalização. Os nomes podem entrar nas conversas com chatbots por meio de entrada direta do usuário (solicitada pelos chatbots), como parte de contextos de tarefas, como revisões de currículos, ou como recursos de memória integrados que armazenam informações do usuário para personalização. Estudamos os vieses associados a nomes medindo as presunções culturais nas respostas geradas por LLMs quando apresentados a consultas comuns que buscam sugestões, o que pode envolver fazer suposições sobre o usuário. Nossas análises demonstram fortes suposições sobre identidade cultural associadas a nomes presentes nas gerações de LLMs em várias culturas. Nosso trabalho tem implicações para o design de sistemas de personalização mais sutis que evitem reforçar estereótipos, mantendo uma customização significativa.
English
Names are deeply tied to human identity. They can serve as markers of
individuality, cultural heritage, and personal history. However, using names as
a core indicator of identity can lead to over-simplification of complex
identities. When interacting with LLMs, user names are an important point of
information for personalisation. Names can enter chatbot conversations through
direct user input (requested by chatbots), as part of task contexts such as CV
reviews, or as built-in memory features that store user information for
personalisation. We study biases associated with names by measuring cultural
presumptions in the responses generated by LLMs when presented with common
suggestion-seeking queries, which might involve making assumptions about the
user. Our analyses demonstrate strong assumptions about cultural identity
associated with names present in LLM generations across multiple cultures. Our
work has implications for designing more nuanced personalisation systems that
avoid reinforcing stereotypes while maintaining meaningful customisation.Summary
AI-Generated Summary