ChatPaper.aiChatPaper

PaperRegister: Verbetering van flexibele zoekopdrachten in wetenschappelijke artikelen via hiërarchische registerindexering

PaperRegister: Boosting Flexible-grained Paper Search via Hierarchical Register Indexing

August 14, 2025
Auteurs: Zhuoqun Li, Xuanang Chen, Hongyu Lin, Yaojie Lu, Xianpei Han, Le Sun
cs.AI

Samenvatting

Het zoeken naar wetenschappelijke artikelen is een belangrijke activiteit voor onderzoekers, waarbij doorgaans een zoekopdracht met een beschrijving van een onderwerp wordt gebruikt om relevante artikelen te vinden. Naarmate het onderzoek zich verdiept, kunnen de vereisten voor het zoeken naar artikelen flexibeler worden, waarbij soms specifieke details zoals moduleconfiguratie betrokken zijn, in plaats van beperkt te blijven tot grofkorrelige onderwerpen. Eerdere systemen voor het zoeken naar artikelen zijn echter niet in staat om aan deze flexibele vereisten te voldoen, aangezien deze systemen voornamelijk samenvattingen van artikelen verzamelen om een index van het corpus op te bouwen, waardoor gedetailleerde informatie ontbreekt die nodig is voor het ophalen van fijnkorrelige zoekopdrachten. In dit werk stellen we PaperRegister voor, dat bestaat uit offline hiërarchische indexering en online adaptieve ophaling, waarbij de traditionele op samenvattingen gebaseerde index wordt omgezet in een hiërarchische indexboom voor het zoeken naar artikelen, waardoor zoekopdrachten op flexibele granulariteit worden ondersteund. Experimenten met taken voor het zoeken naar artikelen over een reeks granulariteiten tonen aan dat PaperRegister de state-of-the-art prestaties bereikt, en met name uitblinkt in fijnkorrelige scenario's, wat het goede potentieel benadrukt als een effectieve oplossing voor flexibel korrelig zoeken naar artikelen in real-world toepassingen. De code voor dit werk is te vinden op https://github.com/Li-Z-Q/PaperRegister.
English
Paper search is an important activity for researchers, typically involving using a query with description of a topic to find relevant papers. As research deepens, paper search requirements may become more flexible, sometimes involving specific details such as module configuration rather than being limited to coarse-grained topics. However, previous paper search systems are unable to meet these flexible-grained requirements, as these systems mainly collect paper abstracts to construct index of corpus, which lack detailed information to support retrieval by finer-grained queries. In this work, we propose PaperRegister, consisted of offline hierarchical indexing and online adaptive retrieval, transforming traditional abstract-based index into hierarchical index tree for paper search, thereby supporting queries at flexible granularity. Experiments on paper search tasks across a range of granularity demonstrate that PaperRegister achieves the state-of-the-art performance, and particularly excels in fine-grained scenarios, highlighting the good potential as an effective solution for flexible-grained paper search in real-world applications. Code for this work is in https://github.com/Li-Z-Q/PaperRegister.
PDF223August 18, 2025