К извлечению пространств взаимодействий для агентного поиска

Аннотация

Поисковые агенты по-прежнему наследуют методологию неагентного информационного поиска: ретривер ранжирует корпус, а агент считывает небольшой набор возвращённых документов. Недавние работы по прямому взаимодействию с корпусом (Direct Corpus Interaction, DCI) показывают, что агенты могут взаимодействовать с исходным корпусом с помощью оболочечных инструментов, таких как grep и чтение файлов. Однако неограниченное взаимодействие не масштабируется: любая широкая команда оболочки означает сканирование всего корпуса, а задержка резко возрастает при его увеличении. Мы утверждаем, что роль поиска для агентного поиска заключается не только в отборе документов, помещающихся в контекстное окно LLM, но и в построении пространства взаимодействия: ограниченного подмножества корпуса, которое агент может исследовать с помощью соответствующих инструментов. Отсюда вытекают два конструктивных следствия. Пространство нуждается в границе, обеспечиваемой поиском, а объекты внутри него должны быть обработаны для взаимодействия. В качестве подтверждения концепции мы предлагаем RISE (Retrieving Interaction SpacE — извлечение пространства взаимодействия): мы используем BM25 для построения пространства взаимодействия; при этом его документы обрабатываются во время индексации для навигации в стиле командной оболочки. На BrowseComp-Plus RISE достигает точности 78% с gpt-5.4-mini при использовании чистого DCI-базиса, затрачивая примерно четверть стоимости на запрос. При 1 миллионе документов RISE-BM25 достигает 81% на gpt-5.4-mini, тогда как DCI на gpt-5.4-nano снижается до 60% при 33 отказах из 100 по реальному времени.

English

Retrieval for search agents is still inherited from non-agentic information retrieval: a retriever ranks the corpus and the agent reads a small set of returned documents. Recent direct corpus interaction (DCI) work shows that agents can instead interact with the raw corpus through shell tools such as grep and file reads. But unbounded interaction does not scale: every broad shell command is a scan over the whole corpus, and latency degrades sharply as the corpus grows. We argue that the role of retrieval for agentic search is not just to select documents that fit in the LLM context window, but to construct an interaction space: a bounded subset of the corpus the agent can explore with associated tools. Two design consequences follow. The space needs a boundary supplied by retrieval, and the objects within it should be processed for interaction. As a proof of concept, we propose RISE (Retrieving Interaction SpacE): we use BM25 to construct the interaction space; meanwhile, its documents are processed during indexing for shell-style navigation. On BrowseComp-Plus, RISE matches the pure-shell DCI baseline at 78% accuracy with gpt-5.4-mini at roughly one quarter of the per-query cost. At 1M documents, RISE-BM25 reaches 81% on gpt-5.4-mini, whereas DCI on gpt-5.4-nano degrades to 60% with 33 of 100 wall-clock failures.