論文出所追跡のためのテキスト駆動型ニューラル協調フィルタリングモデル
Text-Driven Neural Collaborative Filtering Model for Paper Source Tracing
July 25, 2024
著者: Aobo Xu, Bingyu Chang, Qingpeng Liu, Ling Jian
cs.AI
要旨
引用知識グラフの複雑な相互関係において重要な参考文献を特定することは困難な課題であり、これは引用、著者、キーワード、その他の関係属性を通じた接続を含みます。論文ソース追跡(PST)タスクは、高度なデータマイニング技術を活用して、与えられた学術論文の重要な参考文献を自動的に特定することを目指しています。KDD CUP 2024では、PSTタスクに特化した推薦ベースのフレームワークを設計しました。このフレームワークは、最終的な予測を生成するためにニューラル協調フィルタリング(NCF)モデルを採用しています。論文のテキスト属性を処理し、モデルの入力特徴を抽出するために、事前学習済み言語モデルであるSciBERTを利用しています。実験結果によると、私たちの手法は平均適合率(MAP)指標で0.37814のスコアを達成し、ベースラインモデルを上回り、全参加チーム中11位にランクインしました。ソースコードはhttps://github.com/MyLove-XAB/KDDCupFinalで公開されています。
English
Identifying significant references within the complex interrelations of a
citation knowledge graph is challenging, which encompasses connections through
citations, authorship, keywords, and other relational attributes. The Paper
Source Tracing (PST) task seeks to automate the identification of pivotal
references for given scholarly articles utilizing advanced data mining
techniques. In the KDD CUP 2024, we design a recommendation-based framework
tailored for the PST task. This framework employs the Neural Collaborative
Filtering (NCF) model to generate final predictions. To process the textual
attributes of the papers and extract input features for the model, we utilize
SciBERT, a pre-trained language model. According to the experimental results,
our method achieved a score of 0.37814 on the Mean Average Precision (MAP)
metric, outperforming baseline models and ranking 11th among all participating
teams. The source code is publicly available at
https://github.com/MyLove-XAB/KDDCupFinal.Summary
AI-Generated Summary