Vers la récupération des espaces d'interaction pour la recherche agentique

Résumé

La recherche pour les agents de recherche est encore héritée de la recherche d'information non agentique : un système de recherche classe le corpus et l'agent lit un petit ensemble de documents retournés. De récents travaux sur l'interaction directe avec le corpus (DCI) montrent que les agents peuvent interagir directement avec le corpus brut via des outils shell tels que grep et la lecture de fichiers. Mais une interaction illimitée ne passe pas à l'échelle : chaque commande shell large implique un balayage de l'ensemble du corpus, et la latence se dégrade fortement à mesure que le corpus grandit. Nous soutenons que le rôle de la recherche pour la recherche agentique n'est pas seulement de sélectionner des documents qui tiennent dans la fenêtre de contexte du LLM, mais de construire un espace d'interaction : un sous-ensemble borné du corpus que l'agent peut explorer à l'aide d'outils associés. Deux conséquences de conception en découlent. L'espace a besoin d'une frontière fournie par la recherche, et les objets qu'il contient doivent être traités pour l'interaction. Comme preuve de concept, nous proposons RISE (Retrieving Interaction SpacE) : nous utilisons BM25 pour construire l'espace d'interaction ; parallèlement, ses documents sont traités lors de l'indexation pour une navigation de type shell. Sur BrowseComp-Plus, RISE égalise la ligne de base DCI en pur shell avec une précision de 78 % avec gpt-5.4-mini pour environ un quart du coût par requête. À 1 million de documents, RISE-BM25 atteint 81 % sur gpt-5.4-mini, tandis que DCI sur gpt-5.4-nano se dégrade à 60 % avec 33 échecs de temps réel sur 100.

English

Retrieval for search agents is still inherited from non-agentic information retrieval: a retriever ranks the corpus and the agent reads a small set of returned documents. Recent direct corpus interaction (DCI) work shows that agents can instead interact with the raw corpus through shell tools such as grep and file reads. But unbounded interaction does not scale: every broad shell command is a scan over the whole corpus, and latency degrades sharply as the corpus grows. We argue that the role of retrieval for agentic search is not just to select documents that fit in the LLM context window, but to construct an interaction space: a bounded subset of the corpus the agent can explore with associated tools. Two design consequences follow. The space needs a boundary supplied by retrieval, and the objects within it should be processed for interaction. As a proof of concept, we propose RISE (Retrieving Interaction SpacE): we use BM25 to construct the interaction space; meanwhile, its documents are processed during indexing for shell-style navigation. On BrowseComp-Plus, RISE matches the pure-shell DCI baseline at 78% accuracy with gpt-5.4-mini at roughly one quarter of the per-query cost. At 1M documents, RISE-BM25 reaches 81% on gpt-5.4-mini, whereas DCI on gpt-5.4-nano degrades to 60% with 33 of 100 wall-clock failures.