SPAR: Wetenschappelijke Paper Retrieval met LLM-gebaseerde Agents voor Verbeterd Academisch Zoeken
SPAR: Scholar Paper Retrieval with LLM-based Agents for Enhanced Academic Search
July 21, 2025
Auteurs: Xiaofeng Shi, Yuduo Li, Qian Kou, Longbin Yu, Jinxin Xie, Hua Zhou
cs.AI
Samenvatting
Recente ontwikkelingen in grote taalmodellen (LLMs) hebben nieuwe mogelijkheden geopend voor het ophalen van academische literatuur. Bestaande systemen vertrouwen echter vaak op rigide pijplijnen en vertonen beperkte redeneervaardigheden. Wij introduceren SPAR, een multi-agent raamwerk dat RefChain-gebaseerde query-decompositie en query-evolutie incorporeert om een flexibelere en effectievere zoekopdracht mogelijk te maken. Om systematische evaluatie te vergemakkelijken, hebben we ook SPARBench geconstrueerd, een uitdagende benchmark met door experts geannoteerde relevantielabels. Experimentele resultaten tonen aan dat SPAR aanzienlijk beter presteert dan sterke baselines, met een verbetering van tot +56% F1 op AutoScholar en +23% F1 op SPARBench ten opzichte van de best presterende baseline. Samen bieden SPAR en SPARBench een schaalbare, interpreteerbare en hoogpresterende basis voor het bevorderen van onderzoek in wetenschappelijke retrieval. Code en data zullen beschikbaar zijn op: https://github.com/xiaofengShi/SPAR
English
Recent advances in large language models (LLMs) have opened new opportunities
for academic literature retrieval. However, existing systems often rely on
rigid pipelines and exhibit limited reasoning capabilities. We introduce SPAR,
a multi-agent framework that incorporates RefChain-based query decomposition
and query evolution to enable more flexible and effective search. To facilitate
systematic evaluation, we also construct SPARBench, a challenging benchmark
with expert-annotated relevance labels. Experimental results demonstrate that
SPAR substantially outperforms strong baselines, achieving up to +56% F1 on
AutoScholar and +23% F1 on SPARBench over the best-performing baseline.
Together, SPAR and SPARBench provide a scalable, interpretable, and
high-performing foundation for advancing research in scholarly retrieval. Code
and data will be available at: https://github.com/xiaofengShi/SPAR