Spektrum-Projektionswert: Ausrichtung abgerufener Zusammenfassungen an Lesermodellen in der retrieval-augmentierten Generierung
Spectrum Projection Score: Aligning Retrieved Summaries with Reader Models in Retrieval-Augmented Generation
August 8, 2025
papers.authors: Zhanghao Hu, Qinglin Zhu, Siya Qi, Yulan He, Hanqi Yan, Lin Gui
cs.AI
papers.abstract
Große Sprachmodelle (LLMs) haben eine verbesserte Generierungsleistung durch retrievergestützte Generierung (RAG) nach dem Retriever-Reader-Paradigma gezeigt, das die Modelleingaben mit extern abgerufenem Wissen ergänzt. Bisherige Arbeiten bewerten RAG jedoch oft ganzheitlich, indem sie Retriever und Reader gemeinsam beurteilen, was es schwierig macht, den tatsächlichen Beitrag des Retrievals zu isolieren, insbesondere angesichts der Prompt-Sensitivität der als Reader verwendeten LLMs. Wir führen den Spectrum Projection Score (SPS) ein, eine leichtgewichtige, aufsichtsfreie Metrik, die es dem Reader ermöglicht, die semantische Ausrichtung einer abgerufenen Zusammenfassung mit ihrer verborgenen Repräsentation zu bewerten, indem die Fläche verglichen wird, die von den generierten Tokens der Zusammenfassung gebildet wird, und die Hauptrichtungen des Unterraums im Reader, um die Relevanz zu messen. Aufbauend auf SPS präsentieren wir xCompress, ein Framework zur Inferenzzeitsteuerung, das dynamisch abgerufene Zusammenfassungskandidaten sampelt, bewertet und komprimiert. Umfangreiche Experimente auf fünf QA-Benchmarks mit vier Open-Source-LLMs zeigen, dass SPS nicht nur die Leistung über eine Reihe von Aufgaben hinweg verbessert, sondern auch eine prinzipielle Perspektive auf die Interaktion zwischen Retrieval und Generierung bietet.
English
Large Language Models (LLMs) have shown improved generation performance
through retrieval-augmented generation (RAG) following the retriever-reader
paradigm, which supplements model inputs with externally retrieved knowledge.
However, prior work often evaluates RAG holistically, assessing the retriever
and reader jointly, making it difficult to isolate the true contribution of
retrieval, particularly given the prompt sensitivity of LLMs used as readers.
We introduce Spectrum Projection Score (SPS), a lightweight, supervision-free
metric that allows the reader to gauge the semantic alignment of a retrieved
summary with its hidden representation by comparing the area formed by
generated tokens from the summary, and the principal directions of subspace in
the reader and to measure the relevance. Building on SPS we present xCompress,
an inference time controller framework that dynamically samples, ranks, and
compresses retrieval summary candidates. Extensive experiments on five QA
benchmarks with four open source LLMs show that SPS not only enhances
performance across a range of tasks but also provides a principled perspective
on the interaction between retrieval and generation.