Исследование культурной осведомленности в языковых моделях: текст и за его пределами

Аннотация

Масштабное развертывание больших языковых моделей (БЯМ) в различных приложениях, таких как чат-боты и виртуальные ассистенты, требует, чтобы БЯМ были культурно чувствительными к пользователю для обеспечения инклюзивности. Культура широко изучалась в психологии и антропологии, и наблюдается недавний подъем исследований по внедрению культурной инклюзивности в БЯМ, выходящий за рамки мультиязычности и основанный на результатам из психологии и антропологии. В данной статье мы рассматриваем усилия по внедрению культурного осознания в текстовые и мультимодальные БЯМ. Мы начинаем с определения культурного осознания в БЯМ, исходя из определений культуры из антропологии и психологии. Затем мы рассматриваем методики создания межкультурных наборов данных, стратегии культурной инклюзии в задачах на выходе и методики, использованные для оценки культурного осознания в БЯМ. Кроме того, мы обсуждаем этические аспекты культурного соответствия, роль взаимодействия человека с компьютером в содействии культурной инклюзии в БЯМ и роль культурного соответствия в развитии исследований в области социальных наук. Наконец, мы предоставляем указания для будущих исследований на основе выявленных нами пробелов в литературе.

English

Large-scale deployment of large language models (LLMs) in various applications, such as chatbots and virtual assistants, requires LLMs to be culturally sensitive to the user to ensure inclusivity. Culture has been widely studied in psychology and anthropology, and there has been a recent surge in research on making LLMs more culturally inclusive in LLMs that goes beyond multilinguality and builds on findings from psychology and anthropology. In this paper, we survey efforts towards incorporating cultural awareness into text-based and multimodal LLMs. We start by defining cultural awareness in LLMs, taking the definitions of culture from anthropology and psychology as a point of departure. We then examine methodologies adopted for creating cross-cultural datasets, strategies for cultural inclusion in downstream tasks, and methodologies that have been used for benchmarking cultural awareness in LLMs. Further, we discuss the ethical implications of cultural alignment, the role of Human-Computer Interaction in driving cultural inclusion in LLMs, and the role of cultural alignment in driving social science research. We finally provide pointers to future research based on our findings about gaps in the literature.

Исследование культурной осведомленности в языковых моделях: текст и за его пределами

Survey of Cultural Awareness in Language Models: Text and Beyond

Аннотация

Support