Cognitive Kernel-Pro: Um Framework para Agentes de Pesquisa Profunda e Treinamento de Modelos Fundamentais de Agentes
Cognitive Kernel-Pro: A Framework for Deep Research Agents and Agent Foundation Models Training
August 1, 2025
Autores: Tianqing Fang, Zhisong Zhang, Xiaoyang Wang, Rui Wang, Can Qin, Yuxuan Wan, Jun-Yu Ma, Ce Zhang, Jiaqi Chen, Xiyun Li, Hongming Zhang, Haitao Mi, Dong Yu
cs.AI
Resumo
Agentes de IA Geral são cada vez mais reconhecidos como estruturas fundamentais para a próxima geração de inteligência artificial, permitindo raciocínio complexo, interação na web, codificação e capacidades de pesquisa autônoma. No entanto, os sistemas de agentes atuais são ou de código fechado ou dependem fortemente de uma variedade de APIs pagas e ferramentas proprietárias, limitando a acessibilidade e a reprodutibilidade para a comunidade de pesquisa. Neste trabalho, apresentamos o Cognitive Kernel-Pro, uma estrutura de agente multi-módulo totalmente de código aberto e (na máxima medida possível) gratuita, projetada para democratizar o desenvolvimento e a avaliação de agentes de IA avançados. Dentro do Cognitive Kernel-Pro, investigamos sistematicamente a curadoria de dados de treinamento de alta qualidade para Modelos de Base de Agentes, com foco na construção de consultas, trajetórias e respostas verificáveis em quatro domínios principais: web, arquivos, código e raciocínio geral. Além disso, exploramos novas estratégias para reflexão e votação em tempo de teste do agente, visando aumentar a robustez e o desempenho do agente. Avaliamos o Cognitive Kernel-Pro no GAIA, alcançando resultados de ponta entre agentes de código aberto e gratuitos. Notavelmente, nosso modelo de código aberto com 8 bilhões de parâmetros supera sistemas líderes anteriores, como WebDancer e WebSailor, estabelecendo um novo padrão de desempenho para agentes de IA acessíveis e de alta capacidade. O código está disponível em https://github.com/Tencent/CognitiveKernel-Pro.
English
General AI Agents are increasingly recognized as foundational frameworks for
the next generation of artificial intelligence, enabling complex reasoning, web
interaction, coding, and autonomous research capabilities. However, current
agent systems are either closed-source or heavily reliant on a variety of paid
APIs and proprietary tools, limiting accessibility and reproducibility for the
research community. In this work, we present Cognitive Kernel-Pro, a
fully open-source and (to the maximum extent) free multi-module agent framework
designed to democratize the development and evaluation of advanced AI agents.
Within Cognitive Kernel-Pro, we systematically investigate the curation of
high-quality training data for Agent Foundation Models, focusing on the
construction of queries, trajectories, and verifiable answers across four key
domains: web, file, code, and general reasoning. Furthermore, we explore novel
strategies for agent test-time reflection and voting to enhance agent
robustness and performance. We evaluate Cognitive Kernel-Pro on GAIA, achieving
state-of-the-art results among open-source and free agents. Notably, our
8B-parameter open-source model surpasses previous leading systems such as
WebDancer and WebSailor, establishing a new performance standard for
accessible, high-capability AI agents. Code is available at
https://github.com/Tencent/CognitiveKernel-Pro