Zum Retrieval von Interaktionsräumen für agentische Suche

Zusammenfassung

Die Retrieval-Funktion für Suchagenten wird immer noch von der nicht-agentischen Informationssuche übernommen: Ein Retriever bewertet das Korpus und der Agent liest eine kleine Menge zurückgegebener Dokumente. Aktuelle Arbeiten zur direkten Korpusinteraktion (DCI) zeigen, dass Agenten stattdessen mit dem rohen Korpus über Shell-Werkzeuge wie grep und Dateilesen interagieren können. Aber unbegrenzte Interaktion skaliert nicht: Jeder umfassende Shell-Befehl ist ein Scan über das gesamte Korpus, und die Latenz verschlechtert sich stark, je größer das Korpus wird. Wir argumentieren, dass die Rolle des Retrieval für die agentische Suche nicht nur darin besteht, Dokumente auszuwählen, die in das LLM-Kontextfenster passen, sondern einen Interaktionsraum zu konstruieren: eine begrenzte Teilmenge des Korpus, die der Agent mit zugehörigen Werkzeugen erkunden kann. Zwei Designkonsequenzen ergeben sich. Der Raum benötigt eine durch Retrieval bereitgestellte Grenze, und die Objekte darin sollten für die Interaktion aufbereitet werden. Als Proof of Concept schlagen wir RISE (Retrieving Interaction SpacE) vor: Wir verwenden BM25, um den Interaktionsraum zu konstruieren; gleichzeitig werden seine Dokumente während der Indexierung für die Shell-artige Navigation verarbeitet. Auf BrowseComp-Plus erreicht RISE die gleiche Genauigkeit von 78% wie die reine Shell-DCI-Baseline mit gpt-5.4-mini bei etwa einem Viertel der Kosten pro Abfrage. Bei 1 Million Dokumenten erreicht RISE-BM25 mit gpt-5.4-mini 81%, während DCI mit gpt-5.4-nano auf 60% abfällt, mit 33 von 100 Wanduhr-Fehlschlägen.

English

Retrieval for search agents is still inherited from non-agentic information retrieval: a retriever ranks the corpus and the agent reads a small set of returned documents. Recent direct corpus interaction (DCI) work shows that agents can instead interact with the raw corpus through shell tools such as grep and file reads. But unbounded interaction does not scale: every broad shell command is a scan over the whole corpus, and latency degrades sharply as the corpus grows. We argue that the role of retrieval for agentic search is not just to select documents that fit in the LLM context window, but to construct an interaction space: a bounded subset of the corpus the agent can explore with associated tools. Two design consequences follow. The space needs a boundary supplied by retrieval, and the objects within it should be processed for interaction. As a proof of concept, we propose RISE (Retrieving Interaction SpacE): we use BM25 to construct the interaction space; meanwhile, its documents are processed during indexing for shell-style navigation. On BrowseComp-Plus, RISE matches the pure-shell DCI baseline at 78% accuracy with gpt-5.4-mini at roughly one quarter of the per-query cost. At 1M documents, RISE-BM25 reaches 81% on gpt-5.4-mini, whereas DCI on gpt-5.4-nano degrades to 60% with 33 of 100 wall-clock failures.