ChatPaper.aiChatPaper

Tekstgestuurd Neuraal Samenwerkingsfiltermodel voor Bronherkenning van Onderzoeksartikelen

Text-Driven Neural Collaborative Filtering Model for Paper Source Tracing

July 25, 2024
Auteurs: Aobo Xu, Bingyu Chang, Qingpeng Liu, Ling Jian
cs.AI

Samenvatting

Het identificeren van belangrijke referenties binnen de complexe onderlinge relaties van een citatiekennisdiagram is uitdagend, aangezien dit verbanden omvat via citaties, auteurschap, trefwoorden en andere relationele attributen. De Paper Source Tracing (PST)-taak streeft ernaar om de identificatie van cruciale referenties voor gegeven wetenschappelijke artikelen te automatiseren met behulp van geavanceerde dataminingtechnieken. In de KDD CUP 2024 hebben we een op aanbevelingen gebaseerd raamwerk ontworpen dat specifiek is afgestemd op de PST-taak. Dit raamwerk maakt gebruik van het Neural Collaborative Filtering (NCF)-model om uiteindelijke voorspellingen te genereren. Om de tekstuele attributen van de artikelen te verwerken en invoerkenmerken voor het model te extraheren, gebruiken we SciBERT, een vooraf getraind taalmodel. Volgens de experimentele resultaten behaalde onze methode een score van 0,37814 op de Mean Average Precision (MAP)-metriek, wat beter presteert dan baseline-modellen en een 11e plaats oplevert onder alle deelnemende teams. De broncode is openbaar beschikbaar op https://github.com/MyLove-XAB/KDDCupFinal.
English
Identifying significant references within the complex interrelations of a citation knowledge graph is challenging, which encompasses connections through citations, authorship, keywords, and other relational attributes. The Paper Source Tracing (PST) task seeks to automate the identification of pivotal references for given scholarly articles utilizing advanced data mining techniques. In the KDD CUP 2024, we design a recommendation-based framework tailored for the PST task. This framework employs the Neural Collaborative Filtering (NCF) model to generate final predictions. To process the textual attributes of the papers and extract input features for the model, we utilize SciBERT, a pre-trained language model. According to the experimental results, our method achieved a score of 0.37814 on the Mean Average Precision (MAP) metric, outperforming baseline models and ranking 11th among all participating teams. The source code is publicly available at https://github.com/MyLove-XAB/KDDCupFinal.
PDF82February 8, 2026