ChatPaper.aiChatPaper

Agentic-R: Обучение поиску для агентного поиска

Agentic-R: Learning to Retrieve for Agentic Search

January 17, 2026
Авторы: Wenhan Liu, Xinyu Ma, Yutao Zhu, Yuchen Li, Daiting Shi, Dawei Yin, Zhicheng Dou
cs.AI

Аннотация

Недавно появился мощный парадигматический подход — агентный поиск, в котором агент чередует многошаговые рассуждения с поиском по требованию для решения сложных вопросов. Несмотря на успехи, вопрос о том, как разрабатывать системы поиска для агентного поиска, остается малоизученным. Существующие поисковые агенты обычно полагаются на поисковые системы, основанные на схожести, однако похожие фрагменты текстов не всегда полезны для генерации окончательного ответа. В данной статье мы предлагаем новую систему обучения поисковых систем, адаптированную специально для агентного поиска. В отличие от поисковых систем, разработанных для однократного поиска с усиленной генерацией (RAG), которые опираются только на локальную полезность фрагмента, мы предлагаем использовать как локальную релевантность запроса и фрагмента, так и глобальную корректность ответа для оценки полезности фрагмента в многошаговом агентном поиске. Мы также представляем итеративную стратегию обучения, в которой поисковый агент и поисковая система оптимизируются двунаправленно и итеративно. В отличие от поисковых систем RAG, которые обучаются однократно на фиксированных вопросах, наша поисковая система постоянно совершенствуется с использованием развивающихся и более качественных запросов от агента. Многочисленные эксперименты на семи эталонных тестах QA с одно- и многоуровневыми вопросами демонстрируют, что наша поисковая система, названная , стабильно превосходит сильные базовые модели в различных поисковых агентах. Наш код доступен по адресу: https://github.com/8421BCD/Agentic-R.
English
Agentic search has recently emerged as a powerful paradigm, where an agent interleaves multi-step reasoning with on-demand retrieval to solve complex questions. Despite its success, how to design a retriever for agentic search remains largely underexplored. Existing search agents typically rely on similarity-based retrievers, while similar passages are not always useful for final answer generation. In this paper, we propose a novel retriever training framework tailored for agentic search. Unlike retrievers designed for single-turn retrieval-augmented generation (RAG) that only rely on local passage utility, we propose to use both local query-passage relevance and global answer correctness to measure passage utility in a multi-turn agentic search. We further introduce an iterative training strategy, where the search agent and the retriever are optimized bidirectionally and iteratively. Different from RAG retrievers that are only trained once with fixed questions, our retriever is continuously improved using evolving and higher-quality queries from the agent. Extensive experiments on seven single-hop and multi-hop QA benchmarks demonstrate that our retriever, termed , consistently outperforms strong baselines across different search agents. Our codes are available at: https://github.com/8421BCD/Agentic-R.
PDF101January 22, 2026