Levantamento da Consciência Cultural em Modelos de Linguagem: Texto e Além disso
Survey of Cultural Awareness in Language Models: Text and Beyond
October 30, 2024
Autores: Siddhesh Pawar, Junyeong Park, Jiho Jin, Arnav Arora, Junho Myung, Srishti Yadav, Faiz Ghifari Haznitrama, Inhwa Song, Alice Oh, Isabelle Augenstein
cs.AI
Resumo
A implantação em larga escala de grandes modelos de linguagem (LLMs) em diversas aplicações, como chatbots e assistentes virtuais, requer que os LLMs sejam culturalmente sensíveis ao usuário para garantir a inclusão. A cultura tem sido amplamente estudada em psicologia e antropologia, e houve um aumento recente na pesquisa sobre tornar os LLMs mais culturalmente inclusivos, indo além da multilinguismo e se baseando em descobertas da psicologia e antropologia. Neste artigo, fazemos uma análise dos esforços para incorporar a consciência cultural em LLMs baseados em texto e multimodais. Começamos definindo a consciência cultural em LLMs, tomando as definições de cultura da antropologia e psicologia como ponto de partida. Em seguida, examinamos as metodologias adotadas para criar conjuntos de dados transculturais, estratégias para inclusão cultural em tarefas subsequentes e metodologias utilizadas para avaliar a consciência cultural em LLMs. Além disso, discutimos as implicações éticas da alinhamento cultural, o papel da Interação Humano-Computador em impulsionar a inclusão cultural em LLMs e o papel do alinhamento cultural em impulsionar a pesquisa em ciências sociais. Por fim, fornecemos diretrizes para pesquisas futuras com base em nossas descobertas sobre lacunas na literatura.
English
Large-scale deployment of large language models (LLMs) in various
applications, such as chatbots and virtual assistants, requires LLMs to be
culturally sensitive to the user to ensure inclusivity. Culture has been widely
studied in psychology and anthropology, and there has been a recent surge in
research on making LLMs more culturally inclusive in LLMs that goes beyond
multilinguality and builds on findings from psychology and anthropology. In
this paper, we survey efforts towards incorporating cultural awareness into
text-based and multimodal LLMs. We start by defining cultural awareness in
LLMs, taking the definitions of culture from anthropology and psychology as a
point of departure. We then examine methodologies adopted for creating
cross-cultural datasets, strategies for cultural inclusion in downstream tasks,
and methodologies that have been used for benchmarking cultural awareness in
LLMs. Further, we discuss the ethical implications of cultural alignment, the
role of Human-Computer Interaction in driving cultural inclusion in LLMs, and
the role of cultural alignment in driving social science research. We finally
provide pointers to future research based on our findings about gaps in the
literature.Summary
AI-Generated Summary