ChatPaper.aiChatPaper

PaperRegister : Amélioration de la recherche flexible de documents académiques via l'indexation hiérarchique de registres

PaperRegister: Boosting Flexible-grained Paper Search via Hierarchical Register Indexing

August 14, 2025
papers.authors: Zhuoqun Li, Xuanang Chen, Hongyu Lin, Yaojie Lu, Xianpei Han, Le Sun
cs.AI

papers.abstract

La recherche de publications est une activité cruciale pour les chercheurs, impliquant généralement l'utilisation d'une requête décrivant un sujet pour trouver des articles pertinents. À mesure que la recherche progresse, les besoins en matière de recherche de publications peuvent devenir plus flexibles, incluant parfois des détails spécifiques tels que la configuration de modules, plutôt que de se limiter à des sujets généraux. Cependant, les systèmes de recherche de publications existants ne parviennent pas à répondre à ces besoins de granularité flexible, car ces systèmes collectent principalement les résumés d'articles pour construire un index de corpus, ce qui manque d'informations détaillées pour supporter la recherche par des requêtes plus fines. Dans ce travail, nous proposons PaperRegister, composé d'une indexation hiérarchique hors ligne et d'une récupération adaptative en ligne, transformant l'index traditionnel basé sur les résumés en un arbre d'index hiérarchique pour la recherche de publications, permettant ainsi de supporter des requêtes à granularité flexible. Les expériences sur des tâches de recherche de publications à différentes granularités montrent que PaperRegister atteint des performances de pointe, et excelle particulièrement dans les scénarios à granularité fine, mettant en évidence son potentiel en tant que solution efficace pour la recherche de publications à granularité flexible dans des applications réelles. Le code de ce travail est disponible à l'adresse suivante : https://github.com/Li-Z-Q/PaperRegister.
English
Paper search is an important activity for researchers, typically involving using a query with description of a topic to find relevant papers. As research deepens, paper search requirements may become more flexible, sometimes involving specific details such as module configuration rather than being limited to coarse-grained topics. However, previous paper search systems are unable to meet these flexible-grained requirements, as these systems mainly collect paper abstracts to construct index of corpus, which lack detailed information to support retrieval by finer-grained queries. In this work, we propose PaperRegister, consisted of offline hierarchical indexing and online adaptive retrieval, transforming traditional abstract-based index into hierarchical index tree for paper search, thereby supporting queries at flexible granularity. Experiments on paper search tasks across a range of granularity demonstrate that PaperRegister achieves the state-of-the-art performance, and particularly excels in fine-grained scenarios, highlighting the good potential as an effective solution for flexible-grained paper search in real-world applications. Code for this work is in https://github.com/Li-Z-Q/PaperRegister.
PDF223August 18, 2025