Контекст ключевой (NMF): Моделирование динамики тематической информации в китайских диаспорных медиа.
Context is Key(NMF): Modelling Topical Information Dynamics in Chinese Diaspora Media
October 16, 2024
Авторы: Ross Deans Kristensen-McLachlan, Rebecca M. M. Hicke, Márton Kardos, Mette Thunø
cs.AI
Аннотация
Мешает ли Китайская Народная Республика (КНР) европейским выборам через диаспорные СМИ этнических китайцев? Этот вопрос лежит в основе текущего исследовательского проекта, изучающего, как китайские нарративы о европейских выборах представлены в диаспорных китайских СМИ, и, таким образом, цели манипулирования китайскими новостными медиа. Для эффективного и масштабного изучения диаспорных медиа необходимо использовать техники, происходящие из количественного анализа текста, такие как моделирование тематик. В данной статье мы представляем конвейер для изучения динамики информации в китайских медиа. Во-первых, мы представляем KeyNMF, новый подход к статическому и динамическому моделированию тем с использованием моделей контекстуальных вложений на основе трансформеров. Мы предоставляем оценки эталонов, чтобы продемонстрировать, что наш подход конкурентоспособен на ряде китайских наборов данных и метрик. Во-вторых, мы интегрируем KeyNMF с существующими методами описания динамики информации в сложных системах. Мы применяем этот конвейер к данным пяти новостных сайтов, сосредотачиваясь на периоде, предшествующем европейским парламентским выборам 2024 года. Наши методы и результаты демонстрируют эффективность KeyNMF для изучения динамики информации в китайских медиа и заложивают основу для дальнейшей работы, направленной на решение более широких исследовательских вопросов.
English
Does the People's Republic of China (PRC) interfere with European elections
through ethnic Chinese diaspora media? This question forms the basis of an
ongoing research project exploring how PRC narratives about European elections
are represented in Chinese diaspora media, and thus the objectives of PRC news
media manipulation. In order to study diaspora media efficiently and at scale,
it is necessary to use techniques derived from quantitative text analysis, such
as topic modelling. In this paper, we present a pipeline for studying
information dynamics in Chinese media. Firstly, we present KeyNMF, a new
approach to static and dynamic topic modelling using transformer-based
contextual embedding models. We provide benchmark evaluations to demonstrate
that our approach is competitive on a number of Chinese datasets and metrics.
Secondly, we integrate KeyNMF with existing methods for describing information
dynamics in complex systems. We apply this pipeline to data from five news
sites, focusing on the period of time leading up to the 2024 European
parliamentary elections. Our methods and results demonstrate the effectiveness
of KeyNMF for studying information dynamics in Chinese media and lay groundwork
for further work addressing the broader research questions.Summary
AI-Generated Summary