InfoAgent: Vooruitgang in Autonome Informatiezoekende Agentschappen
InfoAgent: Advancing Autonomous Information-Seeking Agents
September 29, 2025
Auteurs: Gongrui Zhang, Jialiang Zhu, Ruiqi Yang, Kai Qiu, Miaosen Zhang, Zhirong Wu, Qi Dai, Bei Liu, Chong Luo, Zhengyuan Yang, Linjie Li, Lijuan Wang, Weizhu Chen, Yuan Zhang, Xin Li, Zhaoyi Liu, Xin Geng, Baining Guo
cs.AI
Samenvatting
Het ontwikkelen van grote taalmodelagenten die hun capaciteiten uitbreiden door interactie met externe tools, vertegenwoordigt een nieuwe grens in AI-onderzoek en -toepassingen. In dit artikel introduceren we InfoAgent, een diepgaande onderzoeksagent aangedreven door een innovatieve datasynthesepijplijn en georkestreerde zoektools op het web. Om uitdagende, moeilijk te vinden vragen te construeren, bouwen we entiteitsbomen en passen we sub-boomsteekproeven toe met entiteitsvervaging om de moeilijkheidsgraad van vragen systematisch te verhogen. In tegenstelling tot eerder werk dat sterk leunt op commerciële zoektools, ontwikkelen we een toegewijde zelf-gehoste zoekinfrastructuur, waardoor de transparantie van agentomgevingen wordt verbeterd en de verdere ontwikkeling van agentcapaciteiten wordt gefaciliteerd. We evalueren de effectiviteit van onze datapijplijn door het gemiddelde aantal toolaanroepen te meten dat nodig is om een vraag correct te beantwoorden, en laten ook zien dat onze agent betere prestaties levert wanneer deze is uitgerust met onze tools. Onze InfoAgent is na-afgestemd vanaf Qwen3-14B met behulp van een tweestapsrecept: cold-start supervised finetuning om langetermijnzoekgedrag in te prenten, gevolgd door reinforcement learning dat het gebruik van tools die door redenering worden aangedreven aanzienlijk verbetert. Met onze methoden behaalt InfoAgent een nauwkeurigheid van 15,3% op BrowseComp, 29,2% op BrowseComp-ZH en 40,4% op Xbench-DS, waarmee het eerdere open-source diepgaande onderzoeksagenten zoals WebSailor-72B en DeepDive-32B overtreft.
English
Building Large Language Model agents that expand their capabilities by
interacting with external tools represents a new frontier in AI research and
applications. In this paper, we introduce InfoAgent, a deep research agent
powered by an innovative data synthesis pipeline and orchestrated web search
tools. To construct challenging, hard-to-find queries,we build entity trees and
apply sub-tree sampling with entity fuzzification to systematically increase
question difficulty. Unlike prior work that relies heavily on commercial search
tools, we develop a dedicated self-hosted search infrastructure, enhancing
transparency of agent environments and facilitating further advancement of
agent capacity. We evaluate the effectiveness of our data pipeline by measuring
the average number of tool calls required to correctly answer a question, and
also show that our agent yields better performance when equipped with our
tools. Our InfoAgent is post-trained from Qwen3-14B using a two-stage
recipe: cold-start supervised finetuning to instill long-horizon search
behaviors, followed by reinforcement learning which significantly improves
reasoning-driven tool use. With our methods, InfoAgent achieves 15.3\% accuracy
on BrowseComp, 29.2\% on BrowseComp-ZH, and 40.4\% on Xbench-DS, outperforming
prior open-source deep research agents such as WebSailor-72B and DeepDive-32B.