FREESON: Retriever-freie, retrieval-augmentierte Argumentation durch korpusdurchquerendes MCTS

papers.abstract

Große Reasoning-Modelle (LRMs) haben bemerkenswerte Fähigkeiten bei der mehrstufigen Argumentation und dem Aufrufen von Suchmaschinen zu geeigneten Zeitpunkten gezeigt. Bisherige retrieval-augmentierte Reasoning-Ansätze verlassen sich jedoch auf separate Retrieval-Modelle, wodurch die Rolle des LRMs beim Retrieval auf die Entscheidung beschränkt wird, wann abgerufen und wie abgefragt werden soll. Diese Trennung erhöht nicht nur die Hardware- und Betriebskosten, sondern führt auch zu Fehlern im Retrieval-Prozess aufgrund des sogenannten Repräsentationsengpasses, einem Phänomen, bei dem der Einbettungsraum des Retrievers nicht ausdrucksstark genug ist, um die Anforderungen des Generators zu erfüllen. Um dies zu beheben, verschieben wir unsere Perspektive von der Sequenz-zu-Sequenz-Zuordnung hin zur Lokalisierung von antwortenthaltenden Pfaden innerhalb des Korpus und schlagen ein neuartiges Framework namens FREESON (Retriever-FREE Retrieval-Augmented ReaSONing) vor. Dieses Framework ermöglicht es LRMs, relevantes Wissen eigenständig abzurufen, indem sie sowohl als Generator als auch als Retriever fungieren. Um dies zu erreichen, führen wir eine Variante des MCTS-Algorithmus ein, die speziell für die Retrieval-Aufgabe entwickelt wurde und die wir CT-MCTS (Corpus-Traversing Monte Carlo Tree Search) nennen. In diesem Algorithmus durchlaufen LRMs den Korpus, um antwortenthaltende Regionen zu finden. Unsere Ergebnisse auf fünf Open-Domain-QA-Benchmarks, einschließlich Single-Hop- und Multi-Hop-Fragen, zeigen, dass FREESON eine durchschnittliche Verbesserung von 14,4 % in EM und F1 gegenüber vier mehrstufigen Reasoning-Modellen mit einem separaten Retriever erzielt und auch vergleichbar mit dem stärksten Baseline-Modell abschneidet, das es auf PopQA um 3 % und auf 2WikiMultihopQA um 2 % übertrifft.

English

Large Reasoning Models (LRMs) have demonstrated remarkable capabilities in multi-step reasoning and calling search engines at appropriate steps. However, existing retrieval-augmented reasoning approaches rely on separate retrieval models, limiting the LRM's role in retrieval to deciding when to retrieve and how to query. This separation not only increases hardware and operational costs but also leads to errors in the retrieval process due to the representation bottleneck, a phenomenon where the retriever's embedding space is not expressive enough to meet the generator's requirements. To address this, we shift our perspective from sequence-to-sequence matching to locating the answer-containing paths within the corpus, and propose a novel framework called FREESON (Retriever-FREE Retrieval-Augmented ReaSONing). This framework enables LRMs to retrieve relevant knowledge on their own by acting as both a generator and retriever. To achieve this, we introduce a variant of the MCTS algorithm specialized for the retrieval task, which we call CT-MCTS (Corpus-Traversing Monte Carlo Tree Search). In this algorithm, LRMs traverse through the corpus toward answer-containing regions. Our results on five open-domain QA benchmarks, including single-hop and multi-hop questions, show that FREESON achieves an average improvement of 14.4% in EM and F1 over four multi-step reasoning models with a separate retriever, and it also performs comparably to the strongest baseline, surpassing it by 3% on PopQA and 2WikiMultihopQA.

FREESON: Retriever-freie, retrieval-augmentierte Argumentation durch korpusdurchquerendes MCTS

FREESON: Retriever-Free Retrieval-Augmented Reasoning via Corpus-Traversing MCTS

papers.abstract

Support