ChatPaper.aiChatPaper

SPAR: Recupero di Articoli Scientifici con Agenti Basati su LLM per una Ricerca Accademica Migliorata

SPAR: Scholar Paper Retrieval with LLM-based Agents for Enhanced Academic Search

July 21, 2025
Autori: Xiaofeng Shi, Yuduo Li, Qian Kou, Longbin Yu, Jinxin Xie, Hua Zhou
cs.AI

Abstract

I recenti progressi nei modelli linguistici di grandi dimensioni (LLM) hanno aperto nuove opportunità per il recupero della letteratura accademica. Tuttavia, i sistemi esistenti spesso si basano su pipeline rigide e mostrano capacità di ragionamento limitate. Introduciamo SPAR, un framework multi-agente che incorpora la scomposizione delle query basata su RefChain e l'evoluzione delle query per consentire una ricerca più flessibile ed efficace. Per facilitare una valutazione sistematica, abbiamo anche costruito SPARBench, un benchmark impegnativo con etichette di rilevanza annotate da esperti. I risultati sperimentali dimostrano che SPAR supera significativamente i baseline più robusti, raggiungendo un miglioramento fino a +56% F1 su AutoScholar e +23% F1 su SPARBench rispetto al baseline con le migliori prestazioni. Insieme, SPAR e SPARBench forniscono una base scalabile, interpretabile e ad alte prestazioni per avanzare la ricerca nel recupero accademico. Il codice e i dati saranno disponibili all'indirizzo: https://github.com/xiaofengShi/SPAR
English
Recent advances in large language models (LLMs) have opened new opportunities for academic literature retrieval. However, existing systems often rely on rigid pipelines and exhibit limited reasoning capabilities. We introduce SPAR, a multi-agent framework that incorporates RefChain-based query decomposition and query evolution to enable more flexible and effective search. To facilitate systematic evaluation, we also construct SPARBench, a challenging benchmark with expert-annotated relevance labels. Experimental results demonstrate that SPAR substantially outperforms strong baselines, achieving up to +56% F1 on AutoScholar and +23% F1 on SPARBench over the best-performing baseline. Together, SPAR and SPARBench provide a scalable, interpretable, and high-performing foundation for advancing research in scholarly retrieval. Code and data will be available at: https://github.com/xiaofengShi/SPAR
PDF111July 23, 2025