Hacia la recuperación de espacios de interacción para la búsqueda agentiva

Resumen

La recuperación para agentes de búsqueda aún se hereda de la recuperación de información no agentiva: un recuperador clasifica el corpus y el agente lee un pequeño conjunto de documentos devueltos. Trabajos recientes sobre interacción directa con el corpus (DCI, por sus siglas en inglés) muestran que los agentes pueden, en cambio, interactuar con el corpus en bruto mediante herramientas de shell como grep y lecturas de archivos. Pero la interacción ilimitada no escala: cada comando amplio de shell es un escaneo de todo el corpus, y la latencia se degrada abruptamente a medida que el corpus crece. Sostenemos que el papel de la recuperación para la búsqueda agentiva no es solo seleccionar documentos que quepan en la ventana de contexto del LLM, sino construir un espacio de interacción: un subconjunto acotado del corpus que el agente pueda explorar con herramientas asociadas. De ello se derivan dos consecuencias de diseño. El espacio necesita un límite proporcionado por la recuperación, y los objetos dentro de él deben procesarse para la interacción. Como prueba de concepto, proponemos RISE (Retrieving Interaction SpacE, espacio de interacción recuperado): utilizamos BM25 para construir el espacio de interacción; mientras tanto, sus documentos se procesan durante la indexación para la navegación tipo shell. En BrowseComp-Plus, RISE iguala la línea base de DCI puro en shell con un 78% de precisión con gpt-5.4-mini a aproximadamente una cuarta parte del costo por consulta. Con 1M de documentos, RISE-BM25 alcanza el 81% en gpt-5.4-mini, mientras que DCI en gpt-5.4-nano se degrada al 60% con 33 de 100 fallos en tiempo real.

English

Retrieval for search agents is still inherited from non-agentic information retrieval: a retriever ranks the corpus and the agent reads a small set of returned documents. Recent direct corpus interaction (DCI) work shows that agents can instead interact with the raw corpus through shell tools such as grep and file reads. But unbounded interaction does not scale: every broad shell command is a scan over the whole corpus, and latency degrades sharply as the corpus grows. We argue that the role of retrieval for agentic search is not just to select documents that fit in the LLM context window, but to construct an interaction space: a bounded subset of the corpus the agent can explore with associated tools. Two design consequences follow. The space needs a boundary supplied by retrieval, and the objects within it should be processed for interaction. As a proof of concept, we propose RISE (Retrieving Interaction SpacE): we use BM25 to construct the interaction space; meanwhile, its documents are processed during indexing for shell-style navigation. On BrowseComp-Plus, RISE matches the pure-shell DCI baseline at 78% accuracy with gpt-5.4-mini at roughly one quarter of the per-query cost. At 1M documents, RISE-BM25 reaches 81% on gpt-5.4-mini, whereas DCI on gpt-5.4-nano degrades to 60% with 33 of 100 wall-clock failures.