ChatPaper.aiChatPaper

HierSearch: 로컬 및 웹 검색을 통합한 계층적 기업용 딥 검색 프레임워크

HierSearch: A Hierarchical Enterprise Deep Search Framework Integrating Local and Web Searches

August 11, 2025
저자: Jiejun Tan, Zhicheng Dou, Yan Yu, Jiehan Cheng, Qiang Ju, Jian Xie, Ji-Rong Wen
cs.AI

초록

최근 대규모 추론 모델들은 강력한 수학적 및 코딩 능력을 보여주었으며, 딥 서치는 이러한 추론 능력을 활용하여 도전적인 정보 검색 작업을 수행합니다. 기존의 딥 서치 연구는 일반적으로 로컬 또는 웹 중 단일 지식 소스에 국한되어 있습니다. 그러나 기업들은 종종 로컬 및 웹 코퍼스 모두에 걸쳐 검색 도구를 활용할 수 있는 개인용 딥 서치 시스템을 요구합니다. 다중 검색 도구를 갖춘 에이전트를 평면적 강화 학습(RL)을 사용하여 훈련시키는 것은 간단한 아이디어이지만, 훈련 데이터 효율성이 낮고 복잡한 도구를 제대로 숙달하지 못하는 등의 문제가 있습니다. 이러한 문제를 해결하기 위해, 우리는 계층적 RL로 훈련된 계층적 에이전트 딥 서치 프레임워크인 HierSearch를 제안합니다. 하위 수준에서는 로컬 딥 서치 에이전트와 웹 딥 서치 에이전트가 각각 해당 도메인에서 증거를 검색하도록 훈련됩니다. 상위 수준에서는 플래너 에이전트가 하위 수준 에이전트들을 조율하고 최종 답변을 제공합니다. 또한, 직접적인 답변 복사와 오류 전파를 방지하기 위해, 우리는 하위 수준 에이전트들이 반환한 환각과 관련 없는 증거를 걸러내는 지식 정제기를 설계했습니다. 실험 결과, HierSearch는 평면적 RL에 비해 더 나은 성능을 달성했으며, 일반, 금융, 의료 도메인에 걸친 여섯 가지 벤치마크에서 다양한 딥 서치 및 다중 소스 검색 강화 생성 기준선들을 능가했습니다.
English
Recently, large reasoning models have demonstrated strong mathematical and coding abilities, and deep search leverages their reasoning capabilities in challenging information retrieval tasks. Existing deep search works are generally limited to a single knowledge source, either local or the Web. However, enterprises often require private deep search systems that can leverage search tools over both local and the Web corpus. Simply training an agent equipped with multiple search tools using flat reinforcement learning (RL) is a straightforward idea, but it has problems such as low training data efficiency and poor mastery of complex tools. To address the above issue, we propose a hierarchical agentic deep search framework, HierSearch, trained with hierarchical RL. At the low level, a local deep search agent and a Web deep search agent are trained to retrieve evidence from their corresponding domains. At the high level, a planner agent coordinates low-level agents and provides the final answer. Moreover, to prevent direct answer copying and error propagation, we design a knowledge refiner that filters out hallucinations and irrelevant evidence returned by low-level agents. Experiments show that HierSearch achieves better performance compared to flat RL, and outperforms various deep search and multi-source retrieval-augmented generation baselines in six benchmarks across general, finance, and medical domains.
PDF263August 13, 2025