ChatPaper.aiChatPaper

HierSearch: Een Hiërarchisch Zakelijk Diepzoekraamwerk dat Lokale en Webzoekopdrachten Integreert

HierSearch: A Hierarchical Enterprise Deep Search Framework Integrating Local and Web Searches

August 11, 2025
Auteurs: Jiejun Tan, Zhicheng Dou, Yan Yu, Jiehan Cheng, Qiang Ju, Jian Xie, Ji-Rong Wen
cs.AI

Samenvatting

Onlangs hebben grote redeneermodellen sterke wiskundige en programmeervaardigheden getoond, en diepe zoekopdrachten benutten hun redeneervermogen bij uitdagende informatiezoektaken. Bestaande werken op het gebied van diepe zoekopdrachten zijn over het algemeen beperkt tot één kennisbron, lokaal of het web. Bedrijven hebben echter vaak behoefte aan privésystemen voor diepe zoekopdrachten die zoekinstrumenten kunnen benutten over zowel lokale als webcorpora. Het simpelweg trainen van een agent uitgerust met meerdere zoekinstrumenten met behulp van vlakke reinforcement learning (RL) is een eenvoudig idee, maar het heeft problemen zoals lage efficiëntie van trainingsgegevens en slechte beheersing van complexe instrumenten. Om het bovenstaande probleem aan te pakken, stellen we een hiërarchisch agent-gebaseerd diep zoekraamwerk voor, HierSearch, getraind met hiërarchische RL. Op het lagere niveau worden een lokale diepe zoekagent en een web diepe zoekagent getraind om bewijs te halen uit hun respectievelijke domeinen. Op het hogere niveau coördineert een planner-agent de lagere agents en geeft het uiteindelijke antwoord. Bovendien, om direct kopiëren van antwoorden en foutpropagatie te voorkomen, ontwerpen we een kennisverfijner die hallucinaties en irrelevant bewijs gefilterd door de lagere agents verwijdert. Experimenten tonen aan dat HierSearch betere prestaties bereikt in vergelijking met vlakke RL, en verschillende diepe zoek- en multi-bron retrieval-augmented generation-baselines overtreft in zes benchmarks in algemene, financiële en medische domeinen.
English
Recently, large reasoning models have demonstrated strong mathematical and coding abilities, and deep search leverages their reasoning capabilities in challenging information retrieval tasks. Existing deep search works are generally limited to a single knowledge source, either local or the Web. However, enterprises often require private deep search systems that can leverage search tools over both local and the Web corpus. Simply training an agent equipped with multiple search tools using flat reinforcement learning (RL) is a straightforward idea, but it has problems such as low training data efficiency and poor mastery of complex tools. To address the above issue, we propose a hierarchical agentic deep search framework, HierSearch, trained with hierarchical RL. At the low level, a local deep search agent and a Web deep search agent are trained to retrieve evidence from their corresponding domains. At the high level, a planner agent coordinates low-level agents and provides the final answer. Moreover, to prevent direct answer copying and error propagation, we design a knowledge refiner that filters out hallucinations and irrelevant evidence returned by low-level agents. Experiments show that HierSearch achieves better performance compared to flat RL, and outperforms various deep search and multi-source retrieval-augmented generation baselines in six benchmarks across general, finance, and medical domains.
PDF293August 13, 2025