ChatPaper.aiChatPaper

PaperRegister: Verbesserung der flexibel granularen Papiersuche durch hierarchische Registerindizierung

PaperRegister: Boosting Flexible-grained Paper Search via Hierarchical Register Indexing

August 14, 2025
papers.authors: Zhuoqun Li, Xuanang Chen, Hongyu Lin, Yaojie Lu, Xianpei Han, Le Sun
cs.AI

papers.abstract

Die Suche nach wissenschaftlichen Artikeln ist eine wichtige Aktivität für Forscher und beinhaltet typischerweise die Verwendung einer Suchanfrage mit einer Beschreibung eines Themas, um relevante Artikel zu finden. Mit zunehmender Vertiefung der Forschung können die Anforderungen an die Artikelsuche flexibler werden, manchmal unter Einbeziehung spezifischer Details wie Modulkonfigurationen, anstatt sich auf grobgranulare Themen zu beschränken. Bisherige Systeme zur Artikelsuche sind jedoch nicht in der Lage, diese flexiblen Anforderungen zu erfüllen, da diese Systeme hauptsächlich Artikelzusammenfassungen sammeln, um einen Index des Korpus zu erstellen, dem detaillierte Informationen fehlen, um die Suche mit feingranularen Anfragen zu unterstützen. In dieser Arbeit schlagen wir PaperRegister vor, das aus einem Offline-Hierarchie-Index und einer Online-adaptiven Suche besteht und den traditionellen abstraktbasierten Index in einen hierarchischen Indexbaum für die Artikelsuche transformiert, wodurch Anfragen mit flexibler Granularität unterstützt werden. Experimente zu Artikelsuche-Aufgaben über eine Reihe von Granularitäten zeigen, dass PaperRegister die beste Leistung erzielt und insbesondere in feingranularen Szenarien hervorragt, was das gute Potenzial als effektive Lösung für flexibel granulare Artikelsuche in realen Anwendungen unterstreicht. Der Code für diese Arbeit ist unter https://github.com/Li-Z-Q/PaperRegister verfügbar.
English
Paper search is an important activity for researchers, typically involving using a query with description of a topic to find relevant papers. As research deepens, paper search requirements may become more flexible, sometimes involving specific details such as module configuration rather than being limited to coarse-grained topics. However, previous paper search systems are unable to meet these flexible-grained requirements, as these systems mainly collect paper abstracts to construct index of corpus, which lack detailed information to support retrieval by finer-grained queries. In this work, we propose PaperRegister, consisted of offline hierarchical indexing and online adaptive retrieval, transforming traditional abstract-based index into hierarchical index tree for paper search, thereby supporting queries at flexible granularity. Experiments on paper search tasks across a range of granularity demonstrate that PaperRegister achieves the state-of-the-art performance, and particularly excels in fine-grained scenarios, highlighting the good potential as an effective solution for flexible-grained paper search in real-world applications. Code for this work is in https://github.com/Li-Z-Q/PaperRegister.
PDF223August 18, 2025