ChatPaper.aiChatPaper

Оценка проекции спектра: согласование извлеченных резюме с моделями читателя в генерации, усиленной извлечением данных

Spectrum Projection Score: Aligning Retrieved Summaries with Reader Models in Retrieval-Augmented Generation

August 8, 2025
Авторы: Zhanghao Hu, Qinglin Zhu, Siya Qi, Yulan He, Hanqi Yan, Lin Gui
cs.AI

Аннотация

Крупные языковые модели (LLM) демонстрируют улучшенные показатели генерации благодаря подходу, основанному на дополнении входных данных внешними знаниями, известному как retrieval-augmented generation (RAG), который следует парадигме "извлечение-чтение". Однако предыдущие исследования часто оценивают RAG в целом, анализируя совместно работу извлекателя и читателя, что затрудняет выделение истинного вклада извлечения, особенно с учетом чувствительности LLM, используемых в качестве читателей, к формулировкам запросов. Мы представляем Spectrum Projection Score (SPS) — легковесную метрику, не требующую обучения с учителем, которая позволяет читателю оценить семантическое соответствие извлеченного резюме его скрытому представлению, сравнивая область, образованную сгенерированными токенами из резюме, и главные направления подпространства в читателе, а также измерять релевантность. На основе SPS мы предлагаем xCompress — фреймворк для управления на этапе вывода, который динамически выбирает, ранжирует и сжимает кандидатов на извлеченные резюме. Эксперименты на пяти наборах данных для вопросно-ответных задач с использованием четырех открытых LLM показывают, что SPS не только повышает производительность в широком спектре задач, но и предоставляет принципиальный взгляд на взаимодействие между извлечением и генерацией.
English
Large Language Models (LLMs) have shown improved generation performance through retrieval-augmented generation (RAG) following the retriever-reader paradigm, which supplements model inputs with externally retrieved knowledge. However, prior work often evaluates RAG holistically, assessing the retriever and reader jointly, making it difficult to isolate the true contribution of retrieval, particularly given the prompt sensitivity of LLMs used as readers. We introduce Spectrum Projection Score (SPS), a lightweight, supervision-free metric that allows the reader to gauge the semantic alignment of a retrieved summary with its hidden representation by comparing the area formed by generated tokens from the summary, and the principal directions of subspace in the reader and to measure the relevance. Building on SPS we present xCompress, an inference time controller framework that dynamically samples, ranks, and compresses retrieval summary candidates. Extensive experiments on five QA benchmarks with four open source LLMs show that SPS not only enhances performance across a range of tasks but also provides a principled perspective on the interaction between retrieval and generation.
PDF202August 12, 2025