Encuesta de Conciencia Cultural en Modelos de Lenguaje: Texto y Más Allá
Survey of Cultural Awareness in Language Models: Text and Beyond
October 30, 2024
Autores: Siddhesh Pawar, Junyeong Park, Jiho Jin, Arnav Arora, Junho Myung, Srishti Yadav, Faiz Ghifari Haznitrama, Inhwa Song, Alice Oh, Isabelle Augenstein
cs.AI
Resumen
La implementación a gran escala de grandes modelos de lenguaje (LLMs, por sus siglas en inglés) en diversas aplicaciones, como chatbots y asistentes virtuales, requiere que los LLMs sean culturalmente sensibles con el usuario para garantizar la inclusividad. La cultura ha sido ampliamente estudiada en psicología y antropología, y ha habido un reciente aumento en la investigación sobre cómo hacer que los LLMs sean más culturalmente inclusivos, yendo más allá de la multilingüidad y basándose en hallazgos de psicología y antropología. En este documento, examinamos los esfuerzos hacia la incorporación de la conciencia cultural en LLMs basados en texto y multimodales. Comenzamos definiendo la conciencia cultural en LLMs, tomando las definiciones de cultura de la antropología y la psicología como punto de partida. Luego examinamos las metodologías adoptadas para la creación de conjuntos de datos interculturales, estrategias para la inclusión cultural en tareas posteriores, y metodologías utilizadas para evaluar la conciencia cultural en LLMs. Además, discutimos las implicaciones éticas de la alineación cultural, el papel de la Interacción Humano-Computadora en impulsar la inclusión cultural en LLMs, y el papel de la alineación cultural en impulsar la investigación en ciencias sociales. Finalmente, proporcionamos indicaciones para futuras investigaciones basadas en nuestros hallazgos sobre las lagunas en la literatura.
English
Large-scale deployment of large language models (LLMs) in various
applications, such as chatbots and virtual assistants, requires LLMs to be
culturally sensitive to the user to ensure inclusivity. Culture has been widely
studied in psychology and anthropology, and there has been a recent surge in
research on making LLMs more culturally inclusive in LLMs that goes beyond
multilinguality and builds on findings from psychology and anthropology. In
this paper, we survey efforts towards incorporating cultural awareness into
text-based and multimodal LLMs. We start by defining cultural awareness in
LLMs, taking the definitions of culture from anthropology and psychology as a
point of departure. We then examine methodologies adopted for creating
cross-cultural datasets, strategies for cultural inclusion in downstream tasks,
and methodologies that have been used for benchmarking cultural awareness in
LLMs. Further, we discuss the ethical implications of cultural alignment, the
role of Human-Computer Interaction in driving cultural inclusion in LLMs, and
the role of cultural alignment in driving social science research. We finally
provide pointers to future research based on our findings about gaps in the
literature.Summary
AI-Generated Summary