SPAR: Recupero di Articoli Scientifici con Agenti Basati su LLM per una Ricerca Accademica Migliorata
SPAR: Scholar Paper Retrieval with LLM-based Agents for Enhanced Academic Search
July 21, 2025
Autori: Xiaofeng Shi, Yuduo Li, Qian Kou, Longbin Yu, Jinxin Xie, Hua Zhou
cs.AI
Abstract
I recenti progressi nei modelli linguistici di grandi dimensioni (LLM) hanno aperto nuove opportunità per il recupero della letteratura accademica. Tuttavia, i sistemi esistenti spesso si basano su pipeline rigide e mostrano capacità di ragionamento limitate. Introduciamo SPAR, un framework multi-agente che incorpora la scomposizione delle query basata su RefChain e l'evoluzione delle query per consentire una ricerca più flessibile ed efficace. Per facilitare una valutazione sistematica, abbiamo anche costruito SPARBench, un benchmark impegnativo con etichette di rilevanza annotate da esperti. I risultati sperimentali dimostrano che SPAR supera significativamente i baseline più robusti, raggiungendo un miglioramento fino a +56% F1 su AutoScholar e +23% F1 su SPARBench rispetto al baseline con le migliori prestazioni. Insieme, SPAR e SPARBench forniscono una base scalabile, interpretabile e ad alte prestazioni per avanzare la ricerca nel recupero accademico. Il codice e i dati saranno disponibili all'indirizzo: https://github.com/xiaofengShi/SPAR
English
Recent advances in large language models (LLMs) have opened new opportunities
for academic literature retrieval. However, existing systems often rely on
rigid pipelines and exhibit limited reasoning capabilities. We introduce SPAR,
a multi-agent framework that incorporates RefChain-based query decomposition
and query evolution to enable more flexible and effective search. To facilitate
systematic evaluation, we also construct SPARBench, a challenging benchmark
with expert-annotated relevance labels. Experimental results demonstrate that
SPAR substantially outperforms strong baselines, achieving up to +56% F1 on
AutoScholar and +23% F1 on SPARBench over the best-performing baseline.
Together, SPAR and SPARBench provide a scalable, interpretable, and
high-performing foundation for advancing research in scholarly retrieval. Code
and data will be available at: https://github.com/xiaofengShi/SPAR