HierSearch: Un Marco de Búsqueda Profunda Jerárquica para Empresas que Integra Búsquedas Locales y en la Web
HierSearch: A Hierarchical Enterprise Deep Search Framework Integrating Local and Web Searches
August 11, 2025
Autores: Jiejun Tan, Zhicheng Dou, Yan Yu, Jiehan Cheng, Qiang Ju, Jian Xie, Ji-Rong Wen
cs.AI
Resumen
Recientemente, los modelos de razonamiento a gran escala han demostrado fuertes habilidades matemáticas y de codificación, y la búsqueda profunda aprovecha sus capacidades de razonamiento en tareas desafiantes de recuperación de información. Los trabajos existentes en búsqueda profunda generalmente se limitan a una única fuente de conocimiento, ya sea local o la Web. Sin embargo, las empresas a menudo requieren sistemas de búsqueda profunda privados que puedan aprovechar herramientas de búsqueda tanto en corpus locales como en la Web. Entrenar un agente equipado con múltiples herramientas de búsqueda utilizando aprendizaje por refuerzo (RL) plano es una idea directa, pero presenta problemas como la baja eficiencia en el uso de datos de entrenamiento y un dominio deficiente de herramientas complejas. Para abordar este problema, proponemos un marco de búsqueda profunda agéntica jerárquica, HierSearch, entrenado con RL jerárquico. En el nivel inferior, se entrena un agente de búsqueda profunda local y un agente de búsqueda profunda en la Web para recuperar evidencia de sus dominios correspondientes. En el nivel superior, un agente planificador coordina a los agentes de nivel inferior y proporciona la respuesta final. Además, para evitar la copia directa de respuestas y la propagación de errores, diseñamos un refinador de conocimiento que filtra las alucinaciones y la evidencia irrelevante devuelta por los agentes de nivel inferior. Los experimentos muestran que HierSearch logra un mejor rendimiento en comparación con RL plano, y supera a varias líneas base de búsqueda profunda y generación aumentada con recuperación de múltiples fuentes en seis benchmarks que abarcan dominios generales, financieros y médicos.
English
Recently, large reasoning models have demonstrated strong mathematical and
coding abilities, and deep search leverages their reasoning capabilities in
challenging information retrieval tasks. Existing deep search works are
generally limited to a single knowledge source, either local or the Web.
However, enterprises often require private deep search systems that can
leverage search tools over both local and the Web corpus. Simply training an
agent equipped with multiple search tools using flat reinforcement learning
(RL) is a straightforward idea, but it has problems such as low training data
efficiency and poor mastery of complex tools. To address the above issue, we
propose a hierarchical agentic deep search framework, HierSearch, trained with
hierarchical RL. At the low level, a local deep search agent and a Web deep
search agent are trained to retrieve evidence from their corresponding domains.
At the high level, a planner agent coordinates low-level agents and provides
the final answer. Moreover, to prevent direct answer copying and error
propagation, we design a knowledge refiner that filters out hallucinations and
irrelevant evidence returned by low-level agents. Experiments show that
HierSearch achieves better performance compared to flat RL, and outperforms
various deep search and multi-source retrieval-augmented generation baselines
in six benchmarks across general, finance, and medical domains.