ChatPaper.aiChatPaper

Búsqueda Agéntica en el Mundo Real: Intenciones y Dinámicas de Trayectoria a partir de más de 14 Millones de Peticiones de Búsqueda Reales

Agentic Search in the Wild: Intents and Trajectory Dynamics from 14M+ Real Search Requests

January 24, 2026
Autores: Jingjie Ning, João Coelho, Yibo Kong, Yunfan Long, Bruno Martins, João Magalhães, Jamie Callan, Chenyan Xiong
cs.AI

Resumen

Los agentes de búsqueda impulsados por LLM se utilizan cada vez más para tareas de búsqueda de información de múltiples pasos, sin embargo, la comunidad de RI carece de una comprensión empírica de cómo se desarrollan las sesiones de búsqueda agentivas y cómo se utiliza la evidencia recuperada. Este artículo presenta un análisis a gran escala de registros de búsqueda agentiva basado en 14.44 millones de solicitudes de búsqueda (3.97 millones de sesiones) recopiladas de DeepResearchGym, es decir, una API de búsqueda de código abierto accedida por clientes agentivos externos. Sistematizamos los registros, asignamos intenciones a nivel de sesión y etiquetas de reformulación de consultas paso a paso utilizando anotación basada en LLM, y proponemos la Tasa de Adopción de Términos Basada en Contexto (CTAR) para cuantificar si los términos de consulta introducidos recientemente son rastreables hasta la evidencia recuperada previamente. Nuestros análisis revelan patrones de comportamiento distintivos. Primero, más del 90% de las sesiones multiturno contienen como máximo diez pasos, y el 89% de los intervalos entre pasos son inferiores a un minuto. Segundo, el comportamiento varía según la intención. Las sesiones de búsqueda de hechos exhiben una alta repetición que aumenta con el tiempo, mientras que las sesiones que requieren razonamiento mantienen una exploración más amplia. Tercero, los agentes reutilizan evidencia entre pasos. En promedio, el 54% de los términos de consulta introducidos recientemente aparecen en el contexto de evidencia acumulada, con contribuciones de pasos anteriores más allá de la recuperación más reciente. Los hallazgos sugieren que la búsqueda agentiva podría beneficiarse de una parada temprana consciente de la repetición, presupuestos de recuperación adaptativos a la intención y un seguimiento explícito del contexto entre pasos. Planeamos publicar los registros anonimizados para apoyar investigaciones futuras.
English
LLM-powered search agents are increasingly being used for multi-step information seeking tasks, yet the IR community lacks empirical understanding of how agentic search sessions unfold and how retrieved evidence is used. This paper presents a large-scale log analysis of agentic search based on 14.44M search requests (3.97M sessions) collected from DeepResearchGym, i.e. an open-source search API accessed by external agentic clients. We sessionize the logs, assign session-level intents and step-wise query-reformulation labels using LLM-based annotation, and propose Context-driven Term Adoption Rate (CTAR) to quantify whether newly introduced query terms are traceable to previously retrieved evidence. Our analyses reveal distinctive behavioral patterns. First, over 90% of multi-turn sessions contain at most ten steps, and 89% of inter-step intervals fall under one minute. Second, behavior varies by intent. Fact-seeking sessions exhibit high repetition that increases over time, while sessions requiring reasoning sustain broader exploration. Third, agents reuse evidence across steps. On average, 54% of newly introduced query terms appear in the accumulated evidence context, with contributions from earlier steps beyond the most recent retrieval. The findings suggest that agentic search may benefit from repetition-aware early stopping, intent-adaptive retrieval budgets, and explicit cross-step context tracking. We plan to release the anonymized logs to support future research.
PDF01January 28, 2026