Модель нейронного коллаборативного фильтра на основе текста для отслеживания источника статьи.
Text-Driven Neural Collaborative Filtering Model for Paper Source Tracing
July 25, 2024
Авторы: Aobo Xu, Bingyu Chang, Qingpeng Liu, Ling Jian
cs.AI
Аннотация
Выявление значимых ссылок в сложных взаимосвязях графа цитирования является сложной задачей, которая охватывает связи через цитирование, авторство, ключевые слова и другие атрибуты отношений. Задача отслеживания источника статьи (PST) направлена на автоматизацию идентификации ключевых ссылок для заданных научных статей с использованием передовых методов data mining. На KDD CUP 2024 мы разработали специализированную рекомендательную структуру для задачи PST. Данная структура использует модель нейронного коллаборативного фильтрования (NCF) для генерации окончательных прогнозов. Для обработки текстовых атрибутов статей и извлечения входных признаков для модели мы используем SciBERT, предварительно обученную языковую модель. Согласно экспериментальным результатам, наш метод достиг показателя 0.37814 по метрике Mean Average Precision (MAP), превзойдя базовые модели и заняв 11-е место среди всех участвующих команд. Исходный код доступен публично по адресу https://github.com/MyLove-XAB/KDDCupFinal.
English
Identifying significant references within the complex interrelations of a
citation knowledge graph is challenging, which encompasses connections through
citations, authorship, keywords, and other relational attributes. The Paper
Source Tracing (PST) task seeks to automate the identification of pivotal
references for given scholarly articles utilizing advanced data mining
techniques. In the KDD CUP 2024, we design a recommendation-based framework
tailored for the PST task. This framework employs the Neural Collaborative
Filtering (NCF) model to generate final predictions. To process the textual
attributes of the papers and extract input features for the model, we utilize
SciBERT, a pre-trained language model. According to the experimental results,
our method achieved a score of 0.37814 on the Mean Average Precision (MAP)
metric, outperforming baseline models and ranking 11th among all participating
teams. The source code is publicly available at
https://github.com/MyLove-XAB/KDDCupFinal.Summary
AI-Generated Summary