Agentic-R: Leren om te zoeken voor agentisch zoeken

Samenvatting

Agentisch zoeken is recent naar voren gekomen als een krachtig paradigma, waarbij een agent meerstapsredenering afwisselt met on-demand retrieval om complexe vragen op te lossen. Ondanks dit succes blijft de vraag hoe een retriever voor agentisch zoeken moet worden ontworpen grotendeels ononderzocht. Bestaande zoekagenten maken doorgaans gebruik van op gelijkenis gebaseerde retrievers, terwijl gelijkaardige passages niet altijd nuttig zijn voor het genereren van het uiteindelijke antwoord. In dit artikel stellen we een nieuw trainingsraamwerk voor retrievers voor, speciaal toegesneden op agentisch zoeken. In tegenstelling tot retrievers die zijn ontworpen voor single-turn retrieval-augmented generation (RAG) en alleen afgaan op lokale passage-nuttigheid, stellen we voor om zowel lokale query-passage-relevantie als globale antwoordnauwkeurigheid te gebruiken om de nuttigheid van een passage in een multi-turn agentische zoekomgeving te meten. We introduceren verder een iteratieve trainingsstrategie, waarbij de zoekagent en de retriever bidirectioneel en iteratief worden geoptimaliseerd. Anders dan RAG-retrievers die slechts éénmaal worden getraind met vaste vragen, wordt onze retriever continu verbeterd met behulp van evoluerende en hogerkwalitatieve queries van de agent. Uitgebreide experimenten op zeven single-hop en multi-hop QA-benchmarks tonen aan dat onze retriever, genaamd , consistent sterke baseline-methoden overtreft across verschillende zoekagenten. Onze code is beschikbaar op: https://github.com/8421BCD/Agentic-R.

English

Agentic search has recently emerged as a powerful paradigm, where an agent interleaves multi-step reasoning with on-demand retrieval to solve complex questions. Despite its success, how to design a retriever for agentic search remains largely underexplored. Existing search agents typically rely on similarity-based retrievers, while similar passages are not always useful for final answer generation. In this paper, we propose a novel retriever training framework tailored for agentic search. Unlike retrievers designed for single-turn retrieval-augmented generation (RAG) that only rely on local passage utility, we propose to use both local query-passage relevance and global answer correctness to measure passage utility in a multi-turn agentic search. We further introduce an iterative training strategy, where the search agent and the retriever are optimized bidirectionally and iteratively. Different from RAG retrievers that are only trained once with fixed questions, our retriever is continuously improved using evolving and higher-quality queries from the agent. Extensive experiments on seven single-hop and multi-hop QA benchmarks demonstrate that our retriever, termed , consistently outperforms strong baselines across different search agents. Our codes are available at: https://github.com/8421BCD/Agentic-R.

Agentic-R: Leren om te zoeken voor agentisch zoeken

Agentic-R: Learning to Retrieve for Agentic Search

Samenvatting

Support