ChatPaper.aiChatPaper

PaperRegister: Impulsionando a Busca Flexível de Artigos por meio de Indexação Hierárquica de Registros

PaperRegister: Boosting Flexible-grained Paper Search via Hierarchical Register Indexing

August 14, 2025
Autores: Zhuoqun Li, Xuanang Chen, Hongyu Lin, Yaojie Lu, Xianpei Han, Le Sun
cs.AI

Resumo

A busca de artigos é uma atividade importante para pesquisadores, geralmente envolvendo o uso de uma consulta com a descrição de um tópico para encontrar artigos relevantes. À medida que a pesquisa se aprofunda, os requisitos de busca de artigos podem se tornar mais flexíveis, às vezes envolvendo detalhes específicos, como a configuração de módulos, em vez de se limitar a tópicos de alto nível. No entanto, os sistemas anteriores de busca de artigos não conseguem atender a esses requisitos de granularidade flexível, pois esses sistemas coletam principalmente resumos de artigos para construir índices do corpus, que carecem de informações detalhadas para suportar a recuperação por consultas de granularidade mais fina. Neste trabalho, propomos o PaperRegister, composto por indexação hierárquica offline e recuperação adaptativa online, transformando o índice tradicional baseado em resumos em uma árvore de índice hierárquico para busca de artigos, suportando assim consultas em granularidade flexível. Experimentos em tarefas de busca de artigos em uma variedade de granularidades demonstram que o PaperRegister alcança o estado da arte em desempenho, e se destaca especialmente em cenários de granularidade fina, destacando o bom potencial como uma solução eficaz para busca de artigos de granularidade flexível em aplicações do mundo real. O código deste trabalho está disponível em https://github.com/Li-Z-Q/PaperRegister.
English
Paper search is an important activity for researchers, typically involving using a query with description of a topic to find relevant papers. As research deepens, paper search requirements may become more flexible, sometimes involving specific details such as module configuration rather than being limited to coarse-grained topics. However, previous paper search systems are unable to meet these flexible-grained requirements, as these systems mainly collect paper abstracts to construct index of corpus, which lack detailed information to support retrieval by finer-grained queries. In this work, we propose PaperRegister, consisted of offline hierarchical indexing and online adaptive retrieval, transforming traditional abstract-based index into hierarchical index tree for paper search, thereby supporting queries at flexible granularity. Experiments on paper search tasks across a range of granularity demonstrate that PaperRegister achieves the state-of-the-art performance, and particularly excels in fine-grained scenarios, highlighting the good potential as an effective solution for flexible-grained paper search in real-world applications. Code for this work is in https://github.com/Li-Z-Q/PaperRegister.
PDF223August 18, 2025