PaperRegister: 階層的レジスタインデックスによる柔軟な粒度の論文検索の強化
PaperRegister: Boosting Flexible-grained Paper Search via Hierarchical Register Indexing
August 14, 2025
著者: Zhuoqun Li, Xuanang Chen, Hongyu Lin, Yaojie Lu, Xianpei Han, Le Sun
cs.AI
要旨
論文検索は研究者にとって重要な活動であり、通常はトピックの説明を含むクエリを使用して関連する論文を見つけることを含みます。研究が深まるにつれ、論文検索の要件はより柔軟になることがあり、粗い粒度のトピックに限定されるのではなく、モジュール構成などの特定の詳細を含む場合もあります。しかし、従来の論文検索システムはこれらの柔軟な粒度の要件を満たすことができません。これらのシステムは主に論文のアブストラクトを収集してコーパスの索引を構築するため、より細かい粒度のクエリによる検索をサポートするための詳細情報が欠けています。本研究では、オフラインの階層的索引とオンラインの適応的検索から成るPaperRegisterを提案し、従来のアブストラクトベースの索引を論文検索のための階層的索引ツリーに変換することで、柔軟な粒度でのクエリをサポートします。さまざまな粒度での論文検索タスクにおける実験により、PaperRegisterが最先端の性能を達成し、特に細かい粒度のシナリオで優れていることが示され、実世界のアプリケーションにおける柔軟な粒度の論文検索の有効なソリューションとしての良い可能性が強調されています。この研究のコードはhttps://github.com/Li-Z-Q/PaperRegisterにあります。
English
Paper search is an important activity for researchers, typically involving
using a query with description of a topic to find relevant papers. As research
deepens, paper search requirements may become more flexible, sometimes
involving specific details such as module configuration rather than being
limited to coarse-grained topics. However, previous paper search systems are
unable to meet these flexible-grained requirements, as these systems mainly
collect paper abstracts to construct index of corpus, which lack detailed
information to support retrieval by finer-grained queries. In this work, we
propose PaperRegister, consisted of offline hierarchical indexing and online
adaptive retrieval, transforming traditional abstract-based index into
hierarchical index tree for paper search, thereby supporting queries at
flexible granularity. Experiments on paper search tasks across a range of
granularity demonstrate that PaperRegister achieves the state-of-the-art
performance, and particularly excels in fine-grained scenarios, highlighting
the good potential as an effective solution for flexible-grained paper search
in real-world applications. Code for this work is in
https://github.com/Li-Z-Q/PaperRegister.