ChatPaper.aiChatPaper

SPAR: Recuperación de Artículos Académicos con Agentes Basados en LLM para Búsquedas Académicas Mejoradas

SPAR: Scholar Paper Retrieval with LLM-based Agents for Enhanced Academic Search

July 21, 2025
Autores: Xiaofeng Shi, Yuduo Li, Qian Kou, Longbin Yu, Jinxin Xie, Hua Zhou
cs.AI

Resumen

Los recientes avances en los modelos de lenguaje de gran escala (LLMs, por sus siglas en inglés) han abierto nuevas oportunidades para la recuperación de literatura académica. Sin embargo, los sistemas existentes suelen depender de flujos de trabajo rígidos y muestran capacidades de razonamiento limitadas. Presentamos SPAR, un marco de trabajo multiagente que incorpora la descomposición de consultas basada en RefChain y la evolución de consultas para permitir búsquedas más flexibles y efectivas. Para facilitar una evaluación sistemática, también construimos SPARBench, un punto de referencia desafiante con etiquetas de relevancia anotadas por expertos. Los resultados experimentales demuestran que SPAR supera sustancialmente a los baselines más robustos, logrando hasta un +56% en F1 en AutoScholar y un +23% en F1 en SPARBench sobre el baseline de mejor rendimiento. En conjunto, SPAR y SPARBench proporcionan una base escalable, interpretable y de alto rendimiento para avanzar en la investigación de la recuperación académica. El código y los datos estarán disponibles en: https://github.com/xiaofengShi/SPAR.
English
Recent advances in large language models (LLMs) have opened new opportunities for academic literature retrieval. However, existing systems often rely on rigid pipelines and exhibit limited reasoning capabilities. We introduce SPAR, a multi-agent framework that incorporates RefChain-based query decomposition and query evolution to enable more flexible and effective search. To facilitate systematic evaluation, we also construct SPARBench, a challenging benchmark with expert-annotated relevance labels. Experimental results demonstrate that SPAR substantially outperforms strong baselines, achieving up to +56% F1 on AutoScholar and +23% F1 on SPARBench over the best-performing baseline. Together, SPAR and SPARBench provide a scalable, interpretable, and high-performing foundation for advancing research in scholarly retrieval. Code and data will be available at: https://github.com/xiaofengShi/SPAR
PDF111July 23, 2025