Modelo de Filtro Colaborativo Neural Orientado por Texto para Rastreamento de Fonte de Artigos
Text-Driven Neural Collaborative Filtering Model for Paper Source Tracing
July 25, 2024
Autores: Aobo Xu, Bingyu Chang, Qingpeng Liu, Ling Jian
cs.AI
Resumo
Identificar referências significativas dentro das complexas inter-relações de um grafo de conhecimento de citações é desafiador, o que engloba conexões por meio de citações, autoria, palavras-chave e outros atributos relacionais. A tarefa de Rastreamento da Fonte do Artigo (PST) busca automatizar a identificação de referências cruciais para artigos acadêmicos específicos utilizando técnicas avançadas de mineração de dados. Na KDD CUP 2024, nós projetamos um framework baseado em recomendações adaptado para a tarefa PST. Este framework emprega o modelo de Filtragem Colaborativa Neural (NCF) para gerar previsões finais. Para processar os atributos textuais dos artigos e extrair características de entrada para o modelo, utilizamos o SciBERT, um modelo de linguagem pré-treinado. De acordo com os resultados experimentais, nosso método alcançou uma pontuação de 0.37814 na métrica de Precisão Média do Rank (MAP), superando os modelos de referência e classificando-se em 11º lugar entre todas as equipes participantes. O código-fonte está publicamente disponível em https://github.com/MyLove-XAB/KDDCupFinal.
English
Identifying significant references within the complex interrelations of a
citation knowledge graph is challenging, which encompasses connections through
citations, authorship, keywords, and other relational attributes. The Paper
Source Tracing (PST) task seeks to automate the identification of pivotal
references for given scholarly articles utilizing advanced data mining
techniques. In the KDD CUP 2024, we design a recommendation-based framework
tailored for the PST task. This framework employs the Neural Collaborative
Filtering (NCF) model to generate final predictions. To process the textual
attributes of the papers and extract input features for the model, we utilize
SciBERT, a pre-trained language model. According to the experimental results,
our method achieved a score of 0.37814 on the Mean Average Precision (MAP)
metric, outperforming baseline models and ranking 11th among all participating
teams. The source code is publicly available at
https://github.com/MyLove-XAB/KDDCupFinal.Summary
AI-Generated Summary