Identidade Cultural Presumida: Como os Nomes Moldam as Respostas de Modelos de Linguagem

Resumo

Os nomes estão profundamente ligados à identidade humana. Eles podem servir como marcadores de individualidade, herança cultural e história pessoal. No entanto, usar nomes como um indicador central de identidade pode levar a uma simplificação excessiva de identidades complexas. Ao interagir com LLMs (Modelos de Linguagem de Grande Escala), os nomes dos usuários são um ponto importante de informação para personalização. Os nomes podem entrar nas conversas com chatbots por meio de entrada direta do usuário (solicitada pelos chatbots), como parte de contextos de tarefas, como revisões de currículos, ou como recursos de memória integrados que armazenam informações do usuário para personalização. Estudamos os vieses associados a nomes medindo as presunções culturais nas respostas geradas por LLMs quando apresentados a consultas comuns que buscam sugestões, o que pode envolver fazer suposições sobre o usuário. Nossas análises demonstram fortes suposições sobre identidade cultural associadas a nomes presentes nas gerações de LLMs em várias culturas. Nosso trabalho tem implicações para o design de sistemas de personalização mais sutis que evitem reforçar estereótipos, mantendo uma customização significativa.

English

Names are deeply tied to human identity. They can serve as markers of individuality, cultural heritage, and personal history. However, using names as a core indicator of identity can lead to over-simplification of complex identities. When interacting with LLMs, user names are an important point of information for personalisation. Names can enter chatbot conversations through direct user input (requested by chatbots), as part of task contexts such as CV reviews, or as built-in memory features that store user information for personalisation. We study biases associated with names by measuring cultural presumptions in the responses generated by LLMs when presented with common suggestion-seeking queries, which might involve making assumptions about the user. Our analyses demonstrate strong assumptions about cultural identity associated with names present in LLM generations across multiple cultures. Our work has implications for designing more nuanced personalisation systems that avoid reinforcing stereotypes while maintaining meaningful customisation.

Identidade Cultural Presumida: Como os Nomes Moldam as Respostas de Modelos de Linguagem

Presumed Cultural Identity: How Names Shape LLM Responses

Resumo

Support