Score de Projection du Spectre : Alignement des Résumés Récupérés avec les Modèles de Lecteur dans la Génération Augmentée par Récupération
Spectrum Projection Score: Aligning Retrieved Summaries with Reader Models in Retrieval-Augmented Generation
August 8, 2025
papers.authors: Zhanghao Hu, Qinglin Zhu, Siya Qi, Yulan He, Hanqi Yan, Lin Gui
cs.AI
papers.abstract
Les modèles de langage de grande taille (LLMs) ont démontré une amélioration des performances de génération grâce à la génération augmentée par récupération (RAG) suivant le paradigme récupérateur-lecteur, qui enrichit les entrées du modèle avec des connaissances récupérées de manière externe. Cependant, les travaux antérieurs évaluent souvent la RAG de manière holistique, en examinant conjointement le récupérateur et le lecteur, ce qui rend difficile l'isolation de la véritable contribution de la récupération, en particulier compte tenu de la sensibilité des LLMs utilisés comme lecteurs aux prompts. Nous introduisons le Score de Projection du Spectre (SPS), une métrique légère et sans supervision qui permet au lecteur d'évaluer l'alignement sémantique d'un résumé récupéré avec sa représentation cachée en comparant la surface formée par les tokens générés à partir du résumé et les directions principales du sous-espace dans le lecteur, afin de mesurer la pertinence. En nous appuyant sur le SPS, nous présentons xCompress, un cadre de contrôle en temps d'inférence qui échantillonne, classe et compresse dynamiquement les candidats de résumés récupérés. Des expériences approfondies sur cinq benchmarks de questions-réponses avec quatre LLMs open source montrent que le SPS non seulement améliore les performances sur une gamme de tâches, mais offre également une perspective théorique sur l'interaction entre la récupération et la génération.
English
Large Language Models (LLMs) have shown improved generation performance
through retrieval-augmented generation (RAG) following the retriever-reader
paradigm, which supplements model inputs with externally retrieved knowledge.
However, prior work often evaluates RAG holistically, assessing the retriever
and reader jointly, making it difficult to isolate the true contribution of
retrieval, particularly given the prompt sensitivity of LLMs used as readers.
We introduce Spectrum Projection Score (SPS), a lightweight, supervision-free
metric that allows the reader to gauge the semantic alignment of a retrieved
summary with its hidden representation by comparing the area formed by
generated tokens from the summary, and the principal directions of subspace in
the reader and to measure the relevance. Building on SPS we present xCompress,
an inference time controller framework that dynamically samples, ranks, and
compresses retrieval summary candidates. Extensive experiments on five QA
benchmarks with four open source LLMs show that SPS not only enhances
performance across a range of tasks but also provides a principled perspective
on the interaction between retrieval and generation.