O Contexto é a Chave (NMF): Modelando a Dinâmica da Informação Temática na Mídia da Diáspora Chinesa
Context is Key(NMF): Modelling Topical Information Dynamics in Chinese Diaspora Media
October 16, 2024
Autores: Ross Deans Kristensen-McLachlan, Rebecca M. M. Hicke, Márton Kardos, Mette Thunø
cs.AI
Resumo
A República Popular da China (RPC) interfere nas eleições europeias através dos meios de comunicação da diáspora chinesa? Esta questão constitui a base de um projeto de pesquisa em andamento que explora como as narrativas da RPC sobre as eleições europeias são representadas nos meios de comunicação da diáspora chinesa, e, portanto, os objetivos da manipulação de notícias da RPC. Para estudar os meios de comunicação da diáspora de forma eficiente e em larga escala, é necessário utilizar técnicas derivadas da análise quantitativa de texto, como modelagem de tópicos. Neste artigo, apresentamos um pipeline para estudar a dinâmica da informação na mídia chinesa. Em primeiro lugar, apresentamos o KeyNMF, uma nova abordagem para modelagem de tópicos estática e dinâmica usando modelos de incorporação contextual baseados em transformadores. Fornecemos avaliações de referência para demonstrar que nossa abordagem é competitiva em diversos conjuntos de dados e métricas chinesas. Em segundo lugar, integramos o KeyNMF com métodos existentes para descrever a dinâmica da informação em sistemas complexos. Aplicamos este pipeline a dados de cinco sites de notícias, focando no período que antecede as eleições parlamentares europeias de 2024. Nossos métodos e resultados demonstram a eficácia do KeyNMF para estudar a dinâmica da informação na mídia chinesa e lançam as bases para trabalhos futuros que abordem questões de pesquisa mais amplas.
English
Does the People's Republic of China (PRC) interfere with European elections
through ethnic Chinese diaspora media? This question forms the basis of an
ongoing research project exploring how PRC narratives about European elections
are represented in Chinese diaspora media, and thus the objectives of PRC news
media manipulation. In order to study diaspora media efficiently and at scale,
it is necessary to use techniques derived from quantitative text analysis, such
as topic modelling. In this paper, we present a pipeline for studying
information dynamics in Chinese media. Firstly, we present KeyNMF, a new
approach to static and dynamic topic modelling using transformer-based
contextual embedding models. We provide benchmark evaluations to demonstrate
that our approach is competitive on a number of Chinese datasets and metrics.
Secondly, we integrate KeyNMF with existing methods for describing information
dynamics in complex systems. We apply this pipeline to data from five news
sites, focusing on the period of time leading up to the 2024 European
parliamentary elections. Our methods and results demonstrate the effectiveness
of KeyNMF for studying information dynamics in Chinese media and lay groundwork
for further work addressing the broader research questions.Summary
AI-Generated Summary