PaperRegister: Impulsionando a Busca Flexível de Artigos por meio de Indexação Hierárquica de Registros
PaperRegister: Boosting Flexible-grained Paper Search via Hierarchical Register Indexing
August 14, 2025
Autores: Zhuoqun Li, Xuanang Chen, Hongyu Lin, Yaojie Lu, Xianpei Han, Le Sun
cs.AI
Resumo
A busca de artigos é uma atividade importante para pesquisadores, geralmente envolvendo o uso de uma consulta com a descrição de um tópico para encontrar artigos relevantes. À medida que a pesquisa se aprofunda, os requisitos de busca de artigos podem se tornar mais flexíveis, às vezes envolvendo detalhes específicos, como a configuração de módulos, em vez de se limitar a tópicos de alto nível. No entanto, os sistemas anteriores de busca de artigos não conseguem atender a esses requisitos de granularidade flexível, pois esses sistemas coletam principalmente resumos de artigos para construir índices do corpus, que carecem de informações detalhadas para suportar a recuperação por consultas de granularidade mais fina. Neste trabalho, propomos o PaperRegister, composto por indexação hierárquica offline e recuperação adaptativa online, transformando o índice tradicional baseado em resumos em uma árvore de índice hierárquico para busca de artigos, suportando assim consultas em granularidade flexível. Experimentos em tarefas de busca de artigos em uma variedade de granularidades demonstram que o PaperRegister alcança o estado da arte em desempenho, e se destaca especialmente em cenários de granularidade fina, destacando o bom potencial como uma solução eficaz para busca de artigos de granularidade flexível em aplicações do mundo real. O código deste trabalho está disponível em https://github.com/Li-Z-Q/PaperRegister.
English
Paper search is an important activity for researchers, typically involving
using a query with description of a topic to find relevant papers. As research
deepens, paper search requirements may become more flexible, sometimes
involving specific details such as module configuration rather than being
limited to coarse-grained topics. However, previous paper search systems are
unable to meet these flexible-grained requirements, as these systems mainly
collect paper abstracts to construct index of corpus, which lack detailed
information to support retrieval by finer-grained queries. In this work, we
propose PaperRegister, consisted of offline hierarchical indexing and online
adaptive retrieval, transforming traditional abstract-based index into
hierarchical index tree for paper search, thereby supporting queries at
flexible granularity. Experiments on paper search tasks across a range of
granularity demonstrate that PaperRegister achieves the state-of-the-art
performance, and particularly excels in fine-grained scenarios, highlighting
the good potential as an effective solution for flexible-grained paper search
in real-world applications. Code for this work is in
https://github.com/Li-Z-Q/PaperRegister.