ChatPaper.aiChatPaper

SPAR: Wissenschaftliche Artikelrecherche mit LLM-basierten Agenten zur verbesserten akademischen Suche

SPAR: Scholar Paper Retrieval with LLM-based Agents for Enhanced Academic Search

July 21, 2025
papers.authors: Xiaofeng Shi, Yuduo Li, Qian Kou, Longbin Yu, Jinxin Xie, Hua Zhou
cs.AI

papers.abstract

Jüngste Fortschritte bei großen Sprachmodellen (LLMs) haben neue Möglichkeiten für die Recherche akademischer Literatur eröffnet. Bestehende Systeme beruhen jedoch oft auf starren Prozessabläufen und zeigen begrenzte Fähigkeiten zur logischen Schlussfolgerung. Wir stellen SPAR vor, ein Multi-Agenten-Framework, das RefChain-basierte Abfragezerlegung und Abfrageevolution integriert, um eine flexiblere und effektivere Suche zu ermöglichen. Um eine systematische Bewertung zu erleichtern, haben wir zudem SPARBench entwickelt, einen anspruchsvollen Benchmark mit von Experten annotierten Relevanzlabels. Experimentelle Ergebnisse zeigen, dass SPAR starke Baseline-Methoden deutlich übertrifft und eine Verbesserung von bis zu +56 % F1 auf AutoScholar und +23 % F1 auf SPARBench gegenüber der besten Baseline erzielt. Zusammen bieten SPAR und SPARBench eine skalierbare, interpretierbare und leistungsstarke Grundlage für die Weiterentwicklung der Forschung im Bereich der wissenschaftlichen Literaturrecherche. Code und Daten werden unter https://github.com/xiaofengShi/SPAR verfügbar sein.
English
Recent advances in large language models (LLMs) have opened new opportunities for academic literature retrieval. However, existing systems often rely on rigid pipelines and exhibit limited reasoning capabilities. We introduce SPAR, a multi-agent framework that incorporates RefChain-based query decomposition and query evolution to enable more flexible and effective search. To facilitate systematic evaluation, we also construct SPARBench, a challenging benchmark with expert-annotated relevance labels. Experimental results demonstrate that SPAR substantially outperforms strong baselines, achieving up to +56% F1 on AutoScholar and +23% F1 on SPARBench over the best-performing baseline. Together, SPAR and SPARBench provide a scalable, interpretable, and high-performing foundation for advancing research in scholarly retrieval. Code and data will be available at: https://github.com/xiaofengShi/SPAR
PDF111July 23, 2025