Cognitive Kernel-Pro: Un Marco de Trabajo para Agentes de Investigación Profunda y Entrenamiento de Modelos Fundacionales de Agentes
Cognitive Kernel-Pro: A Framework for Deep Research Agents and Agent Foundation Models Training
August 1, 2025
Autores: Tianqing Fang, Zhisong Zhang, Xiaoyang Wang, Rui Wang, Can Qin, Yuxuan Wan, Jun-Yu Ma, Ce Zhang, Jiaqi Chen, Xiyun Li, Hongming Zhang, Haitao Mi, Dong Yu
cs.AI
Resumen
Los Agentes de IA General están siendo cada vez más reconocidos como marcos fundamentales para la próxima generación de inteligencia artificial, permitiendo razonamiento complejo, interacción web, codificación y capacidades de investigación autónoma. Sin embargo, los sistemas de agentes actuales son de código cerrado o dependen en gran medida de una variedad de API pagas y herramientas propietarias, lo que limita la accesibilidad y reproducibilidad para la comunidad de investigación. En este trabajo, presentamos Cognitive Kernel-Pro, un marco de agente multi-módulo completamente de código abierto y (en la mayor medida posible) gratuito, diseñado para democratizar el desarrollo y evaluación de agentes de IA avanzados. Dentro de Cognitive Kernel-Pro, investigamos sistemáticamente la curación de datos de entrenamiento de alta calidad para Modelos Fundacionales de Agentes, centrándonos en la construcción de consultas, trayectorias y respuestas verificables en cuatro dominios clave: web, archivos, código y razonamiento general. Además, exploramos estrategias novedosas para la reflexión y votación en tiempo de prueba de los agentes, con el fin de mejorar su robustez y rendimiento. Evaluamos Cognitive Kernel-Pro en GAIA, logrando resultados de vanguardia entre los agentes de código abierto y gratuitos. Notablemente, nuestro modelo de código abierto de 8B parámetros supera a sistemas líderes anteriores como WebDancer y WebSailor, estableciendo un nuevo estándar de rendimiento para agentes de IA accesibles y de alta capacidad. El código está disponible en https://github.com/Tencent/CognitiveKernel-Pro.
English
General AI Agents are increasingly recognized as foundational frameworks for
the next generation of artificial intelligence, enabling complex reasoning, web
interaction, coding, and autonomous research capabilities. However, current
agent systems are either closed-source or heavily reliant on a variety of paid
APIs and proprietary tools, limiting accessibility and reproducibility for the
research community. In this work, we present Cognitive Kernel-Pro, a
fully open-source and (to the maximum extent) free multi-module agent framework
designed to democratize the development and evaluation of advanced AI agents.
Within Cognitive Kernel-Pro, we systematically investigate the curation of
high-quality training data for Agent Foundation Models, focusing on the
construction of queries, trajectories, and verifiable answers across four key
domains: web, file, code, and general reasoning. Furthermore, we explore novel
strategies for agent test-time reflection and voting to enhance agent
robustness and performance. We evaluate Cognitive Kernel-Pro on GAIA, achieving
state-of-the-art results among open-source and free agents. Notably, our
8B-parameter open-source model surpasses previous leading systems such as
WebDancer and WebSailor, establishing a new performance standard for
accessible, high-capability AI agents. Code is available at
https://github.com/Tencent/CognitiveKernel-Pro