ChatPaper.aiChatPaper

Cognitive Kernel-Pro: Um Framework para Agentes de Pesquisa Profunda e Treinamento de Modelos Fundamentais de Agentes

Cognitive Kernel-Pro: A Framework for Deep Research Agents and Agent Foundation Models Training

August 1, 2025
Autores: Tianqing Fang, Zhisong Zhang, Xiaoyang Wang, Rui Wang, Can Qin, Yuxuan Wan, Jun-Yu Ma, Ce Zhang, Jiaqi Chen, Xiyun Li, Hongming Zhang, Haitao Mi, Dong Yu
cs.AI

Resumo

Agentes de IA Geral são cada vez mais reconhecidos como estruturas fundamentais para a próxima geração de inteligência artificial, permitindo raciocínio complexo, interação na web, codificação e capacidades de pesquisa autônoma. No entanto, os sistemas de agentes atuais são ou de código fechado ou dependem fortemente de uma variedade de APIs pagas e ferramentas proprietárias, limitando a acessibilidade e a reprodutibilidade para a comunidade de pesquisa. Neste trabalho, apresentamos o Cognitive Kernel-Pro, uma estrutura de agente multi-módulo totalmente de código aberto e (na máxima medida possível) gratuita, projetada para democratizar o desenvolvimento e a avaliação de agentes de IA avançados. Dentro do Cognitive Kernel-Pro, investigamos sistematicamente a curadoria de dados de treinamento de alta qualidade para Modelos de Base de Agentes, com foco na construção de consultas, trajetórias e respostas verificáveis em quatro domínios principais: web, arquivos, código e raciocínio geral. Além disso, exploramos novas estratégias para reflexão e votação em tempo de teste do agente, visando aumentar a robustez e o desempenho do agente. Avaliamos o Cognitive Kernel-Pro no GAIA, alcançando resultados de ponta entre agentes de código aberto e gratuitos. Notavelmente, nosso modelo de código aberto com 8 bilhões de parâmetros supera sistemas líderes anteriores, como WebDancer e WebSailor, estabelecendo um novo padrão de desempenho para agentes de IA acessíveis e de alta capacidade. O código está disponível em https://github.com/Tencent/CognitiveKernel-Pro.
English
General AI Agents are increasingly recognized as foundational frameworks for the next generation of artificial intelligence, enabling complex reasoning, web interaction, coding, and autonomous research capabilities. However, current agent systems are either closed-source or heavily reliant on a variety of paid APIs and proprietary tools, limiting accessibility and reproducibility for the research community. In this work, we present Cognitive Kernel-Pro, a fully open-source and (to the maximum extent) free multi-module agent framework designed to democratize the development and evaluation of advanced AI agents. Within Cognitive Kernel-Pro, we systematically investigate the curation of high-quality training data for Agent Foundation Models, focusing on the construction of queries, trajectories, and verifiable answers across four key domains: web, file, code, and general reasoning. Furthermore, we explore novel strategies for agent test-time reflection and voting to enhance agent robustness and performance. We evaluate Cognitive Kernel-Pro on GAIA, achieving state-of-the-art results among open-source and free agents. Notably, our 8B-parameter open-source model surpasses previous leading systems such as WebDancer and WebSailor, establishing a new performance standard for accessible, high-capability AI agents. Code is available at https://github.com/Tencent/CognitiveKernel-Pro
PDF904August 4, 2025