Cognitive Kernel-Pro : Un cadre pour les agents de recherche approfondie et l'entraînement des modèles fondamentaux d'agents
Cognitive Kernel-Pro: A Framework for Deep Research Agents and Agent Foundation Models Training
August 1, 2025
papers.authors: Tianqing Fang, Zhisong Zhang, Xiaoyang Wang, Rui Wang, Can Qin, Yuxuan Wan, Jun-Yu Ma, Ce Zhang, Jiaqi Chen, Xiyun Li, Hongming Zhang, Haitao Mi, Dong Yu
cs.AI
papers.abstract
Les agents d'intelligence artificielle générale sont de plus en plus reconnus comme des cadres fondamentaux pour la prochaine génération d'intelligence artificielle, permettant un raisonnement complexe, des interactions web, du codage et des capacités de recherche autonomes. Cependant, les systèmes d'agents actuels sont soit fermés, soit fortement dépendants d'une variété d'API payantes et d'outils propriétaires, limitant ainsi l'accessibilité et la reproductibilité pour la communauté de recherche. Dans ce travail, nous présentons Cognitive Kernel-Pro, un cadre d'agent multi-module entièrement open-source et (dans la mesure du possible) gratuit, conçu pour démocratiser le développement et l'évaluation des agents d'IA avancés. Au sein de Cognitive Kernel-Pro, nous étudions systématiquement la curation de données d'entraînement de haute qualité pour les modèles de base d'agents, en nous concentrant sur la construction de requêtes, de trajectoires et de réponses vérifiables dans quatre domaines clés : web, fichiers, code et raisonnement général. De plus, nous explorons de nouvelles stratégies de réflexion et de vote en temps de test pour améliorer la robustesse et les performances des agents. Nous évaluons Cognitive Kernel-Pro sur GAIA, obtenant des résultats de pointe parmi les agents open-source et gratuits. Notamment, notre modèle open-source à 8 milliards de paramètres surpasse les systèmes leaders précédents tels que WebDancer et WebSailor, établissant une nouvelle norme de performance pour les agents d'IA accessibles et hautement performants. Le code est disponible à l'adresse suivante : https://github.com/Tencent/CognitiveKernel-Pro
English
General AI Agents are increasingly recognized as foundational frameworks for
the next generation of artificial intelligence, enabling complex reasoning, web
interaction, coding, and autonomous research capabilities. However, current
agent systems are either closed-source or heavily reliant on a variety of paid
APIs and proprietary tools, limiting accessibility and reproducibility for the
research community. In this work, we present Cognitive Kernel-Pro, a
fully open-source and (to the maximum extent) free multi-module agent framework
designed to democratize the development and evaluation of advanced AI agents.
Within Cognitive Kernel-Pro, we systematically investigate the curation of
high-quality training data for Agent Foundation Models, focusing on the
construction of queries, trajectories, and verifiable answers across four key
domains: web, file, code, and general reasoning. Furthermore, we explore novel
strategies for agent test-time reflection and voting to enhance agent
robustness and performance. We evaluate Cognitive Kernel-Pro on GAIA, achieving
state-of-the-art results among open-source and free agents. Notably, our
8B-parameter open-source model surpasses previous leading systems such as
WebDancer and WebSailor, establishing a new performance standard for
accessible, high-capability AI agents. Code is available at
https://github.com/Tencent/CognitiveKernel-Pro