HierSearch: Иерархическая корпоративная система глубокого поиска, интегрирующая локальный и веб-поиск
HierSearch: A Hierarchical Enterprise Deep Search Framework Integrating Local and Web Searches
August 11, 2025
Авторы: Jiejun Tan, Zhicheng Dou, Yan Yu, Jiehan Cheng, Qiang Ju, Jian Xie, Ji-Rong Wen
cs.AI
Аннотация
В последнее время крупные модели рассуждений продемонстрировали высокие способности в математике и программировании, а глубокий поиск использует их возможности рассуждения в сложных задачах информационного поиска. Существующие работы по глубокому поиску, как правило, ограничиваются одним источником знаний — локальным или веб-ресурсами. Однако предприятиям часто требуются частные системы глубокого поиска, способные использовать инструменты поиска как в локальных, так и в веб-корпусах. Простое обучение агента, оснащённого несколькими инструментами поиска, с использованием плоского обучения с подкреплением (RL) — это простая идея, но она имеет проблемы, такие как низкая эффективность использования данных для обучения и слабое освоение сложных инструментов. Для решения этой проблемы мы предлагаем иерархическую агентную структуру глубокого поиска, HierSearch, обученную с использованием иерархического RL. На нижнем уровне обучаются локальный агент глубокого поиска и веб-агент глубокого поиска для извлечения доказательств из соответствующих областей. На верхнем уровне агент-планировщик координирует низкоуровневых агентов и предоставляет окончательный ответ. Кроме того, чтобы предотвратить прямое копирование ответов и распространение ошибок, мы разработали уточнитель знаний, который фильтрует галлюцинации и нерелевантные доказательства, возвращаемые низкоуровневыми агентами. Эксперименты показывают, что HierSearch демонстрирует лучшую производительность по сравнению с плоским RL и превосходит различные базовые методы глубокого поиска и генерации, усиленной поиском из нескольких источников, в шести тестах, охватывающих общие, финансовые и медицинские области.
English
Recently, large reasoning models have demonstrated strong mathematical and
coding abilities, and deep search leverages their reasoning capabilities in
challenging information retrieval tasks. Existing deep search works are
generally limited to a single knowledge source, either local or the Web.
However, enterprises often require private deep search systems that can
leverage search tools over both local and the Web corpus. Simply training an
agent equipped with multiple search tools using flat reinforcement learning
(RL) is a straightforward idea, but it has problems such as low training data
efficiency and poor mastery of complex tools. To address the above issue, we
propose a hierarchical agentic deep search framework, HierSearch, trained with
hierarchical RL. At the low level, a local deep search agent and a Web deep
search agent are trained to retrieve evidence from their corresponding domains.
At the high level, a planner agent coordinates low-level agents and provides
the final answer. Moreover, to prevent direct answer copying and error
propagation, we design a knowledge refiner that filters out hallucinations and
irrelevant evidence returned by low-level agents. Experiments show that
HierSearch achieves better performance compared to flat RL, and outperforms
various deep search and multi-source retrieval-augmented generation baselines
in six benchmarks across general, finance, and medical domains.