A Personalidade Molda o Viés de Gênero em Narrativas de LLMs Condicionadas por Personagens no Inglês e no Hindi: Uma Investigação Empírica

Resumo

Os Grandes Modelos de Linguagem (LLMs) estão cada vez mais sendo implantados em aplicações baseadas em personas, como educação, atendimento ao cliente e plataformas sociais, onde os modelos são instruídos a adotar personas específicas ao interagir com os usuários. Embora o condicionamento por persona possa melhorar a experiência e o engajamento do usuário, ele também levanta preocupações sobre como os indícios de personalidade podem interagir com vieses e estereótipos de gênero. Neste trabalho, apresentamos um estudo controlado de geração de histórias condicionadas por persona em inglês e hindi, onde cada história retrata um profissional em atividade na Índia produzindo artefatos específicos de contexto (por exemplo, planos de aula, relatórios, cartas) sob variações sistemáticas de gênero da persona, função ocupacional e traços de personalidade das estruturas HEXACO e Tríade Sombria. Em 23.400 histórias geradas por seis LLMs state-of-the-art, descobrimos que os traços de personalidade estão significativamente associados tanto à magnitude quanto à direção do viés de gênero. Em particular, os traços de personalidade da Tríade Sombria estão consistentemente associados a representações mais estereotipadas em termos de gênero em comparação com os traços socialmente desejáveis do HEXACO, embora essas associações variem entre os modelos e idiomas. Nossos achados demonstram que o viés de gênero nos LLMs não é estático, mas dependente do contexto. Isso sugere que os sistemas condicionados por persona usados em aplicações do mundo real podem introduzir danos representacionais desiguais, reforçando estereótipos de gênero em conteúdos gerados para fins educacionais, profissionais ou sociais.

English

Large Language Models (LLMs) are increasingly deployed in persona-driven applications such as education, customer service, and social platforms, where models are prompted to adopt specific personas when interacting with users. While persona conditioning can improve user experience and engagement, it also raises concerns about how personality cues may interact with gender biases and stereotypes. In this work, we present a controlled study of persona-conditioned story generation in English and Hindi, where each story portrays a working professional in India producing context-specific artifacts (e.g., lesson plans, reports, letters) under systematically varied persona gender, occupational role, and personality traits from the HEXACO and Dark Triad frameworks. Across 23,400 generated stories from six state-of-the-art LLMs, we find that personality traits are significantly associated with both the magnitude and direction of gender bias. In particular, Dark Triad personality traits are consistently associated with higher gender-stereotypical representations compared to socially desirable HEXACO traits, though these associations vary across models and languages. Our findings demonstrate that gender bias in LLMs is not static but context-dependent. This suggests that persona-conditioned systems used in real-world applications may introduce uneven representational harms, reinforcing gender stereotypes in generated educational, professional, or social content.

A Personalidade Molda o Viés de Gênero em Narrativas de LLMs Condicionadas por Personagens no Inglês e no Hindi: Uma Investigação Empírica

Personality Shapes Gender Bias in Persona-Conditioned LLM Narratives Across English and Hindi: An Empirical Investigation

Resumo

Support