ChatPaper.aiChatPaper

InfoAgent: 自律的情報探索エージェントの進化

InfoAgent: Advancing Autonomous Information-Seeking Agents

September 29, 2025
著者: Gongrui Zhang, Jialiang Zhu, Ruiqi Yang, Kai Qiu, Miaosen Zhang, Zhirong Wu, Qi Dai, Bei Liu, Chong Luo, Zhengyuan Yang, Linjie Li, Lijuan Wang, Weizhu Chen, Yuan Zhang, Xin Li, Zhaoyi Liu, Xin Geng, Baining Guo
cs.AI

要旨

外部ツールとの相互作用を通じて能力を拡張する大規模言語モデルエージェントの構築は、AI研究と応用における新たなフロンティアを表している。本論文では、革新的なデータ合成パイプラインとオーケストレーションされたウェブ検索ツールを備えた深層研究エージェントであるInfoAgentを紹介する。挑戦的で見つけにくいクエリを構築するために、エンティティツリーを構築し、エンティティのファジィ化を伴うサブツリーサンプリングを適用して、質問の難易度を体系的に高める。商用検索ツールに大きく依存する従来の研究とは異なり、専用の自己ホスト型検索インフラストラクチャを開発し、エージェント環境の透明性を高め、エージェントの能力のさらなる進化を促進する。データパイプラインの有効性を評価するために、質問に正しく答えるために必要なツール呼び出しの平均回数を測定し、また、当社のツールを備えたエージェントがより優れたパフォーマンスを発揮することを示す。InfoAgentは、Qwen3-14Bを基に、2段階のレシピでポストトレーニングを行った:長期的な検索行動を身につけるためのコールドスタートの教師ありファインチューニングと、推論主導のツール使用を大幅に改善する強化学習である。当社の手法により、InfoAgentはBrowseCompで15.3%、BrowseComp-ZHで29.2%、Xbench-DSで40.4%の精度を達成し、WebSailor-72BやDeepDive-32Bなどの従来のオープンソースの深層研究エージェントを上回った。
English
Building Large Language Model agents that expand their capabilities by interacting with external tools represents a new frontier in AI research and applications. In this paper, we introduce InfoAgent, a deep research agent powered by an innovative data synthesis pipeline and orchestrated web search tools. To construct challenging, hard-to-find queries,we build entity trees and apply sub-tree sampling with entity fuzzification to systematically increase question difficulty. Unlike prior work that relies heavily on commercial search tools, we develop a dedicated self-hosted search infrastructure, enhancing transparency of agent environments and facilitating further advancement of agent capacity. We evaluate the effectiveness of our data pipeline by measuring the average number of tool calls required to correctly answer a question, and also show that our agent yields better performance when equipped with our tools. Our InfoAgent is post-trained from Qwen3-14B using a two-stage recipe: cold-start supervised finetuning to instill long-horizon search behaviors, followed by reinforcement learning which significantly improves reasoning-driven tool use. With our methods, InfoAgent achieves 15.3\% accuracy on BrowseComp, 29.2\% on BrowseComp-ZH, and 40.4\% on Xbench-DS, outperforming prior open-source deep research agents such as WebSailor-72B and DeepDive-32B.
PDF81October 1, 2025