DiepRAG: Stap voor stap denken naar ophalen voor grote taalmodellen
DeepRAG: Thinking to Retrieval Step by Step for Large Language Models
February 3, 2025
Auteurs: Xinyan Guan, Jiali Zeng, Fandong Meng, Chunlei Xin, Yaojie Lu, Hongyu Lin, Xianpei Han, Le Sun, Jie Zhou
cs.AI
Samenvatting
Grote Taalmodellen (LLM's) hebben opmerkelijk potentieel getoond in redeneren, maar kampen nog steeds met ernstige feitelijke hallucinaties als gevolg van actualiteit, nauwkeurigheid en dekking van parametrische kennis. Ondertussen blijft het integreren van redeneren met opvraag-versterkte generatie (RAG) uitdagend vanwege ineffectieve taakdecompositie en overbodige opvraging, wat ruis kan introduceren en de kwaliteit van de respons kan verminderen. In dit artikel stellen we DeepRAG voor, een raamwerk dat opvraging-versterkt redeneren modelleert als een Markov-beslissingsproces (MDP), waardoor strategische en adaptieve opvraging mogelijk is. Door vragen iteratief te decomponeren, bepaalt DeepRAG dynamisch of externe kennis moet worden opgevraagd of dat er vertrouwd moet worden op parametrisch redeneren in elke stap. Experimenten tonen aan dat DeepRAG de opvraagefficiëntie verbetert en de nauwkeurigheid van antwoorden met 21,99% verbetert, wat de effectiviteit ervan aantoont in het optimaliseren van opvraging-versterkt redeneren.
English
Large Language Models (LLMs) have shown remarkable potential in reasoning
while they still suffer from severe factual hallucinations due to timeliness,
accuracy, and coverage of parametric knowledge. Meanwhile, integrating
reasoning with retrieval-augmented generation (RAG) remains challenging due to
ineffective task decomposition and redundant retrieval, which can introduce
noise and degrade response quality. In this paper, we propose DeepRAG, a
framework that models retrieval-augmented reasoning as a Markov Decision
Process (MDP), enabling strategic and adaptive retrieval. By iteratively
decomposing queries, DeepRAG dynamically determines whether to retrieve
external knowledge or rely on parametric reasoning at each step. Experiments
show that DeepRAG improves retrieval efficiency while improving answer accuracy
by 21.99%, demonstrating its effectiveness in optimizing retrieval-augmented
reasoning.Summary
AI-Generated Summary