Rumo à Recuperação de Espaços de Interação para Busca Agêntica

Resumo

A recuperação para agentes de busca ainda é herdada da recuperação de informação não agentiva: um recuperador ranqueia o corpus e o agente lê um pequeno conjunto de documentos retornados. Trabalhos recentes sobre interação direta com o corpus (DCI) mostram que agentes podem, em vez disso, interagir com o corpus bruto por meio de ferramentas de shell, como grep e leitura de arquivos. Mas a interação ilimitada não escala: todo comando de shell abrangente é uma varredura sobre todo o corpus, e a latência se degrada acentuadamente à medida que o corpus cresce. Argumentamos que o papel da recuperação para busca agentiva não é apenas selecionar documentos que cabem na janela de contexto do LLM, mas construir um espaço de interação: um subconjunto delimitado do corpus que o agente pode explorar com ferramentas associadas. Duas consequências de design decorrem disso. O espaço precisa de um limite fornecido pela recuperação, e os objetos dentro dele devem ser processados para interação. Como prova de conceito, propomos o RISE (Retrieving Interaction SpacE): utilizamos BM25 para construir o espaço de interação; enquanto isso, seus documentos são processados durante a indexação para navegação no estilo shell. No BrowseComp-Plus, o RISE iguala a linha de base do DCI puro com shell em 78% de acurácia com gpt-5.4-mini, a aproximadamente um quarto do custo por consulta. Com 1 milhão de documentos, o RISE-BM25 atinge 81% com gpt-5.4-mini, enquanto o DCI com gpt-5.4-nano degrada para 60%, com 33 de 100 falhas de tempo real.

English

Retrieval for search agents is still inherited from non-agentic information retrieval: a retriever ranks the corpus and the agent reads a small set of returned documents. Recent direct corpus interaction (DCI) work shows that agents can instead interact with the raw corpus through shell tools such as grep and file reads. But unbounded interaction does not scale: every broad shell command is a scan over the whole corpus, and latency degrades sharply as the corpus grows. We argue that the role of retrieval for agentic search is not just to select documents that fit in the LLM context window, but to construct an interaction space: a bounded subset of the corpus the agent can explore with associated tools. Two design consequences follow. The space needs a boundary supplied by retrieval, and the objects within it should be processed for interaction. As a proof of concept, we propose RISE (Retrieving Interaction SpacE): we use BM25 to construct the interaction space; meanwhile, its documents are processed during indexing for shell-style navigation. On BrowseComp-Plus, RISE matches the pure-shell DCI baseline at 78% accuracy with gpt-5.4-mini at roughly one quarter of the per-query cost. At 1M documents, RISE-BM25 reaches 81% on gpt-5.4-mini, whereas DCI on gpt-5.4-nano degrades to 60% with 33 of 100 wall-clock failures.