ChatPaper.aiChatPaper

Punteggio di Proiezione dello Spettro: Allineamento dei Riassunti Recuperati con i Modelli del Lettore nella Generazione Aumentata dal Recupero

Spectrum Projection Score: Aligning Retrieved Summaries with Reader Models in Retrieval-Augmented Generation

August 8, 2025
Autori: Zhanghao Hu, Qinglin Zhu, Siya Qi, Yulan He, Hanqi Yan, Lin Gui
cs.AI

Abstract

I modelli linguistici di grandi dimensioni (LLM) hanno dimostrato miglioramenti nelle prestazioni di generazione attraverso la generazione aumentata da recupero (RAG) seguendo il paradigma retriever-reader, che integra gli input del modello con conoscenze recuperate esternamente. Tuttavia, i lavori precedenti spesso valutano la RAG in modo olistico, analizzando congiuntamente il retriever e il reader, rendendo difficile isolare il vero contributo del recupero, specialmente data la sensibilità ai prompt degli LLM utilizzati come reader. Introduciamo lo Spectrum Projection Score (SPS), una metrica leggera e priva di supervisione che consente al reader di valutare l'allineamento semantico di un riassunto recuperato con la sua rappresentazione nascosta confrontando l'area formata dai token generati dal riassunto e le direzioni principali del sottospazio nel reader, misurando così la rilevanza. Basandoci su SPS, presentiamo xCompress, un framework di controllo al momento dell'inferenza che campiona, classifica e comprime dinamicamente i candidati per i riassunti recuperati. Esperimenti estesi su cinque benchmark di domande e risposte con quattro LLM open source dimostrano che SPS non solo migliora le prestazioni in una gamma di task, ma fornisce anche una prospettiva principiata sull'interazione tra recupero e generazione.
English
Large Language Models (LLMs) have shown improved generation performance through retrieval-augmented generation (RAG) following the retriever-reader paradigm, which supplements model inputs with externally retrieved knowledge. However, prior work often evaluates RAG holistically, assessing the retriever and reader jointly, making it difficult to isolate the true contribution of retrieval, particularly given the prompt sensitivity of LLMs used as readers. We introduce Spectrum Projection Score (SPS), a lightweight, supervision-free metric that allows the reader to gauge the semantic alignment of a retrieved summary with its hidden representation by comparing the area formed by generated tokens from the summary, and the principal directions of subspace in the reader and to measure the relevance. Building on SPS we present xCompress, an inference time controller framework that dynamically samples, ranks, and compresses retrieval summary candidates. Extensive experiments on five QA benchmarks with four open source LLMs show that SPS not only enhances performance across a range of tasks but also provides a principled perspective on the interaction between retrieval and generation.
PDF212August 12, 2025