InfoAgent: 自律的情報探索エージェントの進化
InfoAgent: Advancing Autonomous Information-Seeking Agents
September 29, 2025
著者: Gongrui Zhang, Jialiang Zhu, Ruiqi Yang, Kai Qiu, Miaosen Zhang, Zhirong Wu, Qi Dai, Bei Liu, Chong Luo, Zhengyuan Yang, Linjie Li, Lijuan Wang, Weizhu Chen, Yuan Zhang, Xin Li, Zhaoyi Liu, Xin Geng, Baining Guo
cs.AI
要旨
外部ツールとの相互作用を通じて能力を拡張する大規模言語モデルエージェントの構築は、AI研究と応用における新たなフロンティアを表している。本論文では、革新的なデータ合成パイプラインとオーケストレーションされたウェブ検索ツールを備えた深層研究エージェントであるInfoAgentを紹介する。挑戦的で見つけにくいクエリを構築するために、エンティティツリーを構築し、エンティティのファジィ化を伴うサブツリーサンプリングを適用して、質問の難易度を体系的に高める。商用検索ツールに大きく依存する従来の研究とは異なり、専用の自己ホスト型検索インフラストラクチャを開発し、エージェント環境の透明性を高め、エージェントの能力のさらなる進化を促進する。データパイプラインの有効性を評価するために、質問に正しく答えるために必要なツール呼び出しの平均回数を測定し、また、当社のツールを備えたエージェントがより優れたパフォーマンスを発揮することを示す。InfoAgentは、Qwen3-14Bを基に、2段階のレシピでポストトレーニングを行った:長期的な検索行動を身につけるためのコールドスタートの教師ありファインチューニングと、推論主導のツール使用を大幅に改善する強化学習である。当社の手法により、InfoAgentはBrowseCompで15.3%、BrowseComp-ZHで29.2%、Xbench-DSで40.4%の精度を達成し、WebSailor-72BやDeepDive-32Bなどの従来のオープンソースの深層研究エージェントを上回った。
English
Building Large Language Model agents that expand their capabilities by
interacting with external tools represents a new frontier in AI research and
applications. In this paper, we introduce InfoAgent, a deep research agent
powered by an innovative data synthesis pipeline and orchestrated web search
tools. To construct challenging, hard-to-find queries,we build entity trees and
apply sub-tree sampling with entity fuzzification to systematically increase
question difficulty. Unlike prior work that relies heavily on commercial search
tools, we develop a dedicated self-hosted search infrastructure, enhancing
transparency of agent environments and facilitating further advancement of
agent capacity. We evaluate the effectiveness of our data pipeline by measuring
the average number of tool calls required to correctly answer a question, and
also show that our agent yields better performance when equipped with our
tools. Our InfoAgent is post-trained from Qwen3-14B using a two-stage
recipe: cold-start supervised finetuning to instill long-horizon search
behaviors, followed by reinforcement learning which significantly improves
reasoning-driven tool use. With our methods, InfoAgent achieves 15.3\% accuracy
on BrowseComp, 29.2\% on BrowseComp-ZH, and 40.4\% on Xbench-DS, outperforming
prior open-source deep research agents such as WebSailor-72B and DeepDive-32B.