Identidad Cultural Presumida: Cómo los Nombres Moldean las Respuestas de los Modelos de Lenguaje
Presumed Cultural Identity: How Names Shape LLM Responses
February 17, 2025
Autores: Siddhesh Pawar, Arnav Arora, Lucie-Aimée Kaffee, Isabelle Augenstein
cs.AI
Resumen
Los nombres están profundamente ligados a la identidad humana. Pueden servir como marcadores de individualidad, herencia cultural e historia personal. Sin embargo, utilizar los nombres como un indicador central de la identidad puede llevar a una simplificación excesiva de identidades complejas. Al interactuar con LLMs (modelos de lenguaje grandes), los nombres de los usuarios son un punto de información importante para la personalización. Los nombres pueden aparecer en conversaciones con chatbots a través de la entrada directa del usuario (solicitada por los chatbots), como parte de contextos de tareas, como revisiones de currículums, o como funciones de memoria integradas que almacenan información del usuario para la personalización. Estudiamos los sesgos asociados con los nombres midiendo las presunciones culturales en las respuestas generadas por los LLMs cuando se presentan consultas comunes que buscan sugerencias, las cuales podrían implicar hacer suposiciones sobre el usuario. Nuestros análisis demuestran fuertes suposiciones sobre la identidad cultural asociada con los nombres presentes en las generaciones de LLMs a través de múltiples culturas. Nuestro trabajo tiene implicaciones para diseñar sistemas de personalización más matizados que eviten reforzar estereotipos mientras mantienen una personalización significativa.
English
Names are deeply tied to human identity. They can serve as markers of
individuality, cultural heritage, and personal history. However, using names as
a core indicator of identity can lead to over-simplification of complex
identities. When interacting with LLMs, user names are an important point of
information for personalisation. Names can enter chatbot conversations through
direct user input (requested by chatbots), as part of task contexts such as CV
reviews, or as built-in memory features that store user information for
personalisation. We study biases associated with names by measuring cultural
presumptions in the responses generated by LLMs when presented with common
suggestion-seeking queries, which might involve making assumptions about the
user. Our analyses demonstrate strong assumptions about cultural identity
associated with names present in LLM generations across multiple cultures. Our
work has implications for designing more nuanced personalisation systems that
avoid reinforcing stereotypes while maintaining meaningful customisation.Summary
AI-Generated Summary