LLM-unabhängiges adaptives RAG: Lassen Sie die Frage für sich selbst sprechen
LLM-Independent Adaptive RAG: Let the Question Speak for Itself
May 7, 2025
Autoren: Maria Marina, Nikolay Ivanov, Sergey Pletenev, Mikhail Salnikov, Daria Galimzianova, Nikita Krayko, Vasily Konovalov, Alexander Panchenko, Viktor Moskvoretskii
cs.AI
Zusammenfassung
Große Sprachmodelle (LLMs) neigen zu Halluzinationen, und Retrieval-Augmented Generation (RAG) hilft dabei, dies zu mildern, jedoch mit hohem Rechenaufwand und dem Risiko von Fehlinformationen. Adaptive Retrieval zielt darauf ab, nur bei Bedarf Informationen abzurufen, aber bestehende Ansätze stützen sich auf unsichere Schätzungen durch LLMs, die ineffizient und unpraktisch bleiben. In dieser Studie führen wir leichte, LLM-unabhängige adaptive Retrieval-Methoden ein, die auf externen Informationen basieren. Wir untersuchten 27 Merkmale, die in 7 Gruppen organisiert sind, sowie deren hybride Kombinationen. Wir bewerteten diese Methoden anhand von 6 Frage-Antwort-Datensätzen und analysierten die Leistung und Effizienz der QA-Systeme. Die Ergebnisse zeigen, dass unser Ansatz die Leistung komplexer LLM-basierter Methoden erreicht, während er erhebliche Effizienzgewinne erzielt, was das Potenzial externer Informationen für adaptives Retrieval demonstriert.
English
Large Language Models~(LLMs) are prone to hallucinations, and
Retrieval-Augmented Generation (RAG) helps mitigate this, but at a high
computational cost while risking misinformation. Adaptive retrieval aims to
retrieve only when necessary, but existing approaches rely on LLM-based
uncertainty estimation, which remain inefficient and impractical. In this
study, we introduce lightweight LLM-independent adaptive retrieval methods
based on external information. We investigated 27 features, organized into 7
groups, and their hybrid combinations. We evaluated these methods on 6 QA
datasets, assessing the QA performance and efficiency. The results show that
our approach matches the performance of complex LLM-based methods while
achieving significant efficiency gains, demonstrating the potential of external
information for adaptive retrieval.Summary
AI-Generated Summary