コンテキストは重要です(NMF):中国人ディアスポラメディアにおけるトピカル情報ダイナミクスのモデリング

Context is Key(NMF): Modelling Topical Information Dynamics in Chinese Diaspora Media

October 16, 2024
著者: Ross Deans Kristensen-McLachlan, Rebecca M. M. Hicke, Márton Kardos, Mette Thunø
cs.AI

要旨

中国人民共和国(PRC)は、欧州選挙において中国系ディアスポラメディアを介して干渉しているのか?この問いは、PRCが欧州選挙に関するナラティブが中国系ディアスポラメディアでどのように表現されているか、そしてPRCニュースメディアの操作目的を探る進行中の研究プロジェクトの基盤を形成しています。ディアスポラメディアを効率的かつ大規模に研究するためには、トピックモデリングなどの定量的テキスト分析から派生した手法を使用する必要があります。本論文では、中国メディアにおける情報ダイナミクスを研究するためのパイプラインを提案します。まず、トランスフォーマーベースのコンテキスト埋め込みモデルを使用した、静的および動的トピックモデリングの新しいアプローチであるKeyNMFを紹介します。中国の複数のデータセットとメトリクスにおいて、提案手法が競争力を持つことを示すベンチマーク評価を提供します。次に、KeyNMFを複雑なシステムにおける情報ダイナミクスの記述に既存の手法と統合します。2024年欧州議会選挙直前の期間に焦点を当て、5つのニュースサイトからのデータにこのパイプラインを適用します。我々の手法と結果は、中国メディアにおける情報ダイナミクスを研究するためのKeyNMFの効果を示し、より広範な研究問題に取り組むための基盤を築いています。
English
Does the People's Republic of China (PRC) interfere with European elections through ethnic Chinese diaspora media? This question forms the basis of an ongoing research project exploring how PRC narratives about European elections are represented in Chinese diaspora media, and thus the objectives of PRC news media manipulation. In order to study diaspora media efficiently and at scale, it is necessary to use techniques derived from quantitative text analysis, such as topic modelling. In this paper, we present a pipeline for studying information dynamics in Chinese media. Firstly, we present KeyNMF, a new approach to static and dynamic topic modelling using transformer-based contextual embedding models. We provide benchmark evaluations to demonstrate that our approach is competitive on a number of Chinese datasets and metrics. Secondly, we integrate KeyNMF with existing methods for describing information dynamics in complex systems. We apply this pipeline to data from five news sites, focusing on the period of time leading up to the 2024 European parliamentary elections. Our methods and results demonstrate the effectiveness of KeyNMF for studying information dynamics in Chinese media and lay groundwork for further work addressing the broader research questions.
PDF53November 16, 2024