Puntuación de Proyección del Espectro: Alineación de Resúmenes Recuperados con Modelos del Lector en Generación Aumentada por Recuperación
Spectrum Projection Score: Aligning Retrieved Summaries with Reader Models in Retrieval-Augmented Generation
August 8, 2025
Autores: Zhanghao Hu, Qinglin Zhu, Siya Qi, Yulan He, Hanqi Yan, Lin Gui
cs.AI
Resumen
Los Modelos de Lenguaje de Gran Escala (LLMs, por sus siglas en inglés) han demostrado un mejor rendimiento en la generación mediante la generación aumentada por recuperación (RAG, por sus siglas en inglés), siguiendo el paradigma de recuperador-lector, que complementa las entradas del modelo con conocimiento recuperado externamente. Sin embargo, trabajos previos suelen evaluar RAG de manera holística, analizando conjuntamente el recuperador y el lector, lo que dificulta aislar la verdadera contribución de la recuperación, especialmente dada la sensibilidad a las indicaciones de los LLMs utilizados como lectores. Introducimos el Puntaje de Proyección del Espectro (SPS, por sus siglas en inglés), una métrica ligera y sin supervisión que permite al lector evaluar la alineación semántica de un resumen recuperado con su representación oculta, comparando el área formada por los tokens generados a partir del resumen y las direcciones principales del subespacio en el lector, para medir la relevancia. Basándonos en SPS, presentamos xCompress, un marco de control en tiempo de inferencia que muestrea, clasifica y comprime dinámicamente candidatos de resúmenes recuperados. Experimentos extensos en cinco conjuntos de referencia de preguntas y respuestas con cuatro LLMs de código abierto muestran que SPS no solo mejora el rendimiento en una variedad de tareas, sino que también proporciona una perspectiva fundamentada sobre la interacción entre la recuperación y la generación.
English
Large Language Models (LLMs) have shown improved generation performance
through retrieval-augmented generation (RAG) following the retriever-reader
paradigm, which supplements model inputs with externally retrieved knowledge.
However, prior work often evaluates RAG holistically, assessing the retriever
and reader jointly, making it difficult to isolate the true contribution of
retrieval, particularly given the prompt sensitivity of LLMs used as readers.
We introduce Spectrum Projection Score (SPS), a lightweight, supervision-free
metric that allows the reader to gauge the semantic alignment of a retrieved
summary with its hidden representation by comparing the area formed by
generated tokens from the summary, and the principal directions of subspace in
the reader and to measure the relevance. Building on SPS we present xCompress,
an inference time controller framework that dynamically samples, ranks, and
compresses retrieval summary candidates. Extensive experiments on five QA
benchmarks with four open source LLMs show that SPS not only enhances
performance across a range of tasks but also provides a principled perspective
on the interaction between retrieval and generation.