ChatPaper.aiChatPaper

PaperRegister: 階層的レジスタインデックスによる柔軟な粒度の論文検索の強化

PaperRegister: Boosting Flexible-grained Paper Search via Hierarchical Register Indexing

August 14, 2025
著者: Zhuoqun Li, Xuanang Chen, Hongyu Lin, Yaojie Lu, Xianpei Han, Le Sun
cs.AI

要旨

論文検索は研究者にとって重要な活動であり、通常はトピックの説明を含むクエリを使用して関連する論文を見つけることを含みます。研究が深まるにつれ、論文検索の要件はより柔軟になることがあり、粗い粒度のトピックに限定されるのではなく、モジュール構成などの特定の詳細を含む場合もあります。しかし、従来の論文検索システムはこれらの柔軟な粒度の要件を満たすことができません。これらのシステムは主に論文のアブストラクトを収集してコーパスの索引を構築するため、より細かい粒度のクエリによる検索をサポートするための詳細情報が欠けています。本研究では、オフラインの階層的索引とオンラインの適応的検索から成るPaperRegisterを提案し、従来のアブストラクトベースの索引を論文検索のための階層的索引ツリーに変換することで、柔軟な粒度でのクエリをサポートします。さまざまな粒度での論文検索タスクにおける実験により、PaperRegisterが最先端の性能を達成し、特に細かい粒度のシナリオで優れていることが示され、実世界のアプリケーションにおける柔軟な粒度の論文検索の有効なソリューションとしての良い可能性が強調されています。この研究のコードはhttps://github.com/Li-Z-Q/PaperRegisterにあります。
English
Paper search is an important activity for researchers, typically involving using a query with description of a topic to find relevant papers. As research deepens, paper search requirements may become more flexible, sometimes involving specific details such as module configuration rather than being limited to coarse-grained topics. However, previous paper search systems are unable to meet these flexible-grained requirements, as these systems mainly collect paper abstracts to construct index of corpus, which lack detailed information to support retrieval by finer-grained queries. In this work, we propose PaperRegister, consisted of offline hierarchical indexing and online adaptive retrieval, transforming traditional abstract-based index into hierarchical index tree for paper search, thereby supporting queries at flexible granularity. Experiments on paper search tasks across a range of granularity demonstrate that PaperRegister achieves the state-of-the-art performance, and particularly excels in fine-grained scenarios, highlighting the good potential as an effective solution for flexible-grained paper search in real-world applications. Code for this work is in https://github.com/Li-Z-Q/PaperRegister.
PDF223August 18, 2025