ChatPaper.aiChatPaper

Agentic-R : Apprentissage du processus de recherche pour une exploration agentique

Agentic-R: Learning to Retrieve for Agentic Search

January 17, 2026
papers.authors: Wenhan Liu, Xinyu Ma, Yutao Zhu, Yuchen Li, Daiting Shi, Dawei Yin, Zhicheng Dou
cs.AI

papers.abstract

La recherche agentique a récemment émergé comme un paradigme puissant, dans lequel un agent entrelace un raisonnement à multiples étapes avec une récupération d'informations à la demande pour résoudre des questions complexes. Malgré son succès, la conception d'un système de récupération pour la recherche agentique reste largement inexplorée. Les agents de recherche existants reposent généralement sur des systèmes de récupération par similarité, alors que des passages similaires ne sont pas toujours utiles pour la génération de la réponse finale. Dans cet article, nous proposons un nouveau cadre d'entraînement pour les systèmes de récupération spécifiquement conçu pour la recherche agentique. Contrairement aux systèmes conçus pour la génération augmentée par récupération (RAG) en tour unique qui ne reposent que sur l'utilité locale des passages, nous proposons d'utiliser à la fois la pertinence locale requête-passage et la justesse globale de la réponse pour mesurer l'utilité d'un passage dans un contexte de recherche agentique multi-tours. Nous introduisons en outre une stratégie d'entraînement itérative, où l'agent de recherche et le système de récupération sont optimisés de manière bidirectionnelle et itérative. Contrairement aux systèmes RAG qui ne sont entraînés qu'une fois avec des questions fixes, notre système de récupération est continuellement amélioré en utilisant des requêtes évolutives et de meilleure qualité provenant de l'agent. Des expériences approfondies sur sept benchmarks de questions-réponses à saut unique et multi-sauts démontrent que notre système de récupération, nommé , surpasse constamment les bases de référence solides sur différents agents de recherche. Nos codes sont disponibles à l'adresse : https://github.com/8421BCD/Agentic-R.
English
Agentic search has recently emerged as a powerful paradigm, where an agent interleaves multi-step reasoning with on-demand retrieval to solve complex questions. Despite its success, how to design a retriever for agentic search remains largely underexplored. Existing search agents typically rely on similarity-based retrievers, while similar passages are not always useful for final answer generation. In this paper, we propose a novel retriever training framework tailored for agentic search. Unlike retrievers designed for single-turn retrieval-augmented generation (RAG) that only rely on local passage utility, we propose to use both local query-passage relevance and global answer correctness to measure passage utility in a multi-turn agentic search. We further introduce an iterative training strategy, where the search agent and the retriever are optimized bidirectionally and iteratively. Different from RAG retrievers that are only trained once with fixed questions, our retriever is continuously improved using evolving and higher-quality queries from the agent. Extensive experiments on seven single-hop and multi-hop QA benchmarks demonstrate that our retriever, termed , consistently outperforms strong baselines across different search agents. Our codes are available at: https://github.com/8421BCD/Agentic-R.
PDF101January 22, 2026