ChatPaper.aiChatPaper

PaperRegister: 계층적 레지스터 인덱싱을 통한 유연한 세분화 논문 검색 강화

PaperRegister: Boosting Flexible-grained Paper Search via Hierarchical Register Indexing

August 14, 2025
저자: Zhuoqun Li, Xuanang Chen, Hongyu Lin, Yaojie Lu, Xianpei Han, Le Sun
cs.AI

초록

논문 검색은 연구자들에게 중요한 활동으로, 일반적으로 특정 주제를 설명하는 쿼리를 사용하여 관련 논문을 찾는 과정을 포함합니다. 연구가 심화됨에 따라 논문 검색 요구사항은 더 유연해질 수 있으며, 때로는 거시적인 주제에 국한되지 않고 모듈 구성과 같은 세부 사항을 포함하기도 합니다. 그러나 기존의 논문 검색 시스템은 이러한 유연한 세분화 요구사항을 충족할 수 없는데, 이는 이러한 시스템이 주로 논문 초록을 수집하여 코퍼스 인덱스를 구성하기 때문에 더 세분화된 쿼리에 대한 검색을 지원할 수 있는 상세 정보가 부족하기 때문입니다. 본 연구에서는 오프라인 계층적 인덱싱과 온라인 적응형 검색으로 구성된 PaperRegister를 제안합니다. 이는 기존의 초록 기반 인덱스를 계층적 인덱스 트리로 변환하여 유연한 세분화 수준의 쿼리를 지원합니다. 다양한 세분화 수준에서의 논문 검색 작업에 대한 실험 결과, PaperRegister는 최첨단 성능을 달성했으며, 특히 세밀한 시나리오에서 뛰어난 성능을 보여 실제 애플리케이션에서 유연한 세분화 논문 검색을 위한 효과적인 솔루션으로서의 좋은 잠재력을 강조합니다. 본 연구의 코드는 https://github.com/Li-Z-Q/PaperRegister에서 확인할 수 있습니다.
English
Paper search is an important activity for researchers, typically involving using a query with description of a topic to find relevant papers. As research deepens, paper search requirements may become more flexible, sometimes involving specific details such as module configuration rather than being limited to coarse-grained topics. However, previous paper search systems are unable to meet these flexible-grained requirements, as these systems mainly collect paper abstracts to construct index of corpus, which lack detailed information to support retrieval by finer-grained queries. In this work, we propose PaperRegister, consisted of offline hierarchical indexing and online adaptive retrieval, transforming traditional abstract-based index into hierarchical index tree for paper search, thereby supporting queries at flexible granularity. Experiments on paper search tasks across a range of granularity demonstrate that PaperRegister achieves the state-of-the-art performance, and particularly excels in fine-grained scenarios, highlighting the good potential as an effective solution for flexible-grained paper search in real-world applications. Code for this work is in https://github.com/Li-Z-Q/PaperRegister.
PDF223August 18, 2025