Spectrum Projectie Score: Afstemming van Opgehaalde Samenvattingen met Lezersmodellen in Retrieval-Augmented Generation
Spectrum Projection Score: Aligning Retrieved Summaries with Reader Models in Retrieval-Augmented Generation
August 8, 2025
Auteurs: Zhanghao Hu, Qinglin Zhu, Siya Qi, Yulan He, Hanqi Yan, Lin Gui
cs.AI
Samenvatting
Grote Taalmodellen (LLMs) hebben verbeterde generatieprestaties laten zien door middel van retrieval-augmented generation (RAG) volgens het retriever-reader paradigma, waarbij modelinvoer wordt aangevuld met extern opgehaalde kennis. Eerdere onderzoeken evalueren RAG echter vaak holistisch, waarbij de retriever en reader gezamenlijk worden beoordeeld, wat het moeilijk maakt om de werkelijke bijdrage van retrieval te isoleren, vooral gezien de promptgevoeligheid van LLMs die als reader worden gebruikt. Wij introduceren de Spectrum Projection Score (SPS), een lichtgewicht, toezichtsvrije metriek die de reader in staat stelt om de semantische afstemming van een opgehaalde samenvatting met zijn verborgen representatie te beoordelen door het gebied te vergelijken dat wordt gevormd door gegenereerde tokens uit de samenvatting, en de hoofdrichtingen van de deelruimte in de reader, en om de relevantie te meten. Op basis van SPS presenteren we xCompress, een raamwerk voor inferentietijdcontrole dat dynamisch samenvattingskandidaten voor retrieval bemonstert, rangschikt en comprimeert. Uitgebreide experimenten op vijf QA-benchmarks met vier open-source LLMs tonen aan dat SPS niet alleen de prestaties over een reeks taken verbetert, maar ook een principieel perspectief biedt op de interactie tussen retrieval en generatie.
English
Large Language Models (LLMs) have shown improved generation performance
through retrieval-augmented generation (RAG) following the retriever-reader
paradigm, which supplements model inputs with externally retrieved knowledge.
However, prior work often evaluates RAG holistically, assessing the retriever
and reader jointly, making it difficult to isolate the true contribution of
retrieval, particularly given the prompt sensitivity of LLMs used as readers.
We introduce Spectrum Projection Score (SPS), a lightweight, supervision-free
metric that allows the reader to gauge the semantic alignment of a retrieved
summary with its hidden representation by comparing the area formed by
generated tokens from the summary, and the principal directions of subspace in
the reader and to measure the relevance. Building on SPS we present xCompress,
an inference time controller framework that dynamically samples, ranks, and
compresses retrieval summary candidates. Extensive experiments on five QA
benchmarks with four open source LLMs show that SPS not only enhances
performance across a range of tasks but also provides a principled perspective
on the interaction between retrieval and generation.