El contexto es clave (NMF): Modelado de la dinámica de información temática en los medios de la diáspora china.
Context is Key(NMF): Modelling Topical Information Dynamics in Chinese Diaspora Media
October 16, 2024
Autores: Ross Deans Kristensen-McLachlan, Rebecca M. M. Hicke, Márton Kardos, Mette Thunø
cs.AI
Resumen
¿Interfiere la República Popular China (RPC) en las elecciones europeas a través de los medios de la diáspora china étnica? Esta cuestión constituye la base de un proyecto de investigación en curso que explora cómo las narrativas de la RPC sobre las elecciones europeas están representadas en los medios de la diáspora china, y por ende, los objetivos de la manipulación de noticias de la RPC. Para estudiar eficientemente y a gran escala los medios de la diáspora, es necesario utilizar técnicas derivadas del análisis cuantitativo de texto, como el modelado de temas. En este documento, presentamos un flujo de trabajo para estudiar la dinámica de la información en los medios chinos. En primer lugar, presentamos KeyNMF, un nuevo enfoque para el modelado de temas estáticos y dinámicos utilizando modelos de incrustación contextual basados en transformadores. Proporcionamos evaluaciones de referencia para demostrar que nuestro enfoque es competitivo en varios conjuntos de datos y métricas chinas. En segundo lugar, integramos KeyNMF con métodos existentes para describir la dinámica de la información en sistemas complejos. Aplicamos este flujo de trabajo a datos de cinco sitios de noticias, centrándonos en el período previo a las elecciones parlamentarias europeas de 2024. Nuestros métodos y resultados demuestran la efectividad de KeyNMF para estudiar la dinámica de la información en los medios chinos y sientan las bases para futuros trabajos que aborden preguntas de investigación más amplias.
English
Does the People's Republic of China (PRC) interfere with European elections
through ethnic Chinese diaspora media? This question forms the basis of an
ongoing research project exploring how PRC narratives about European elections
are represented in Chinese diaspora media, and thus the objectives of PRC news
media manipulation. In order to study diaspora media efficiently and at scale,
it is necessary to use techniques derived from quantitative text analysis, such
as topic modelling. In this paper, we present a pipeline for studying
information dynamics in Chinese media. Firstly, we present KeyNMF, a new
approach to static and dynamic topic modelling using transformer-based
contextual embedding models. We provide benchmark evaluations to demonstrate
that our approach is competitive on a number of Chinese datasets and metrics.
Secondly, we integrate KeyNMF with existing methods for describing information
dynamics in complex systems. We apply this pipeline to data from five news
sites, focusing on the period of time leading up to the 2024 European
parliamentary elections. Our methods and results demonstrate the effectiveness
of KeyNMF for studying information dynamics in Chinese media and lay groundwork
for further work addressing the broader research questions.Summary
AI-Generated Summary