ChatPaper.aiChatPaper

InfoAgent: Развитие автономных агентов для поиска информации

InfoAgent: Advancing Autonomous Information-Seeking Agents

September 29, 2025
Авторы: Gongrui Zhang, Jialiang Zhu, Ruiqi Yang, Kai Qiu, Miaosen Zhang, Zhirong Wu, Qi Dai, Bei Liu, Chong Luo, Zhengyuan Yang, Linjie Li, Lijuan Wang, Weizhu Chen, Yuan Zhang, Xin Li, Zhaoyi Liu, Xin Geng, Baining Guo
cs.AI

Аннотация

Создание агентов на основе больших языковых моделей, которые расширяют свои возможности за счет взаимодействия с внешними инструментами, представляет собой новую границу в исследованиях и приложениях искусственного интеллекта. В данной статье мы представляем InfoAgent — глубокого исследовательского агента, работающего на основе инновационного конвейера синтеза данных и скоординированных инструментов веб-поиска. Для создания сложных, труднодоступных запросов мы строим деревья сущностей и применяем выборку поддеревьев с фаззификацией сущностей, чтобы систематически повышать сложность вопросов. В отличие от предыдущих работ, которые в значительной степени полагаются на коммерческие инструменты поиска, мы разрабатываем собственную автономную поисковую инфраструктуру, повышая прозрачность среды агента и способствуя дальнейшему развитию его возможностей. Мы оцениваем эффективность нашего конвейера данных, измеряя среднее количество вызовов инструментов, необходимых для правильного ответа на вопрос, а также показываем, что наш агент демонстрирует лучшую производительность при использовании наших инструментов. Наш InfoAgent дообучается на основе модели Qwen3-14B с использованием двухэтапного подхода: начального контролируемого тонкого обучения для формирования поведения долгосрочного поиска, за которым следует обучение с подкреплением, значительно улучшающее использование инструментов на основе рассуждений. С помощью наших методов InfoAgent достигает точности 15,3% на BrowseComp, 29,2% на BrowseComp-ZH и 40,4% на Xbench-DS, превосходя предыдущие открытые глубокие исследовательские агенты, такие как WebSailor-72B и DeepDive-32B.
English
Building Large Language Model agents that expand their capabilities by interacting with external tools represents a new frontier in AI research and applications. In this paper, we introduce InfoAgent, a deep research agent powered by an innovative data synthesis pipeline and orchestrated web search tools. To construct challenging, hard-to-find queries,we build entity trees and apply sub-tree sampling with entity fuzzification to systematically increase question difficulty. Unlike prior work that relies heavily on commercial search tools, we develop a dedicated self-hosted search infrastructure, enhancing transparency of agent environments and facilitating further advancement of agent capacity. We evaluate the effectiveness of our data pipeline by measuring the average number of tool calls required to correctly answer a question, and also show that our agent yields better performance when equipped with our tools. Our InfoAgent is post-trained from Qwen3-14B using a two-stage recipe: cold-start supervised finetuning to instill long-horizon search behaviors, followed by reinforcement learning which significantly improves reasoning-driven tool use. With our methods, InfoAgent achieves 15.3\% accuracy on BrowseComp, 29.2\% on BrowseComp-ZH, and 40.4\% on Xbench-DS, outperforming prior open-source deep research agents such as WebSailor-72B and DeepDive-32B.
PDF81October 1, 2025