Cognitive Kernel-Pro: 딥 리서치 에이전트 및 에이전트 파운데이션 모델 훈련을 위한 프레임워크
Cognitive Kernel-Pro: A Framework for Deep Research Agents and Agent Foundation Models Training
August 1, 2025
저자: Tianqing Fang, Zhisong Zhang, Xiaoyang Wang, Rui Wang, Can Qin, Yuxuan Wan, Jun-Yu Ma, Ce Zhang, Jiaqi Chen, Xiyun Li, Hongming Zhang, Haitao Mi, Dong Yu
cs.AI
초록
일반 AI 에이전트는 복잡한 추론, 웹 상호작용, 코딩, 그리고 자율적인 연구 능력을 가능하게 하는 차세대 인공지능의 기반 프레임워크로 점점 더 인식되고 있습니다. 그러나 현재의 에이전트 시스템은 오픈소스가 아니거나 다양한 유료 API와 독점 도구에 크게 의존하고 있어, 연구 커뮤니티의 접근성과 재현성을 제한하고 있습니다. 본 연구에서는 고급 AI 에이전트의 개발과 평가를 민주화하기 위해 완전히 오픈소스이며 (최대한) 무료인 다중 모듈 에이전트 프레임워크인 Cognitive Kernel-Pro를 소개합니다. Cognitive Kernel-Pro 내에서 우리는 에이전트 기반 모델을 위한 고품질 학습 데이터의 선별을 체계적으로 연구하며, 웹, 파일, 코드, 그리고 일반 추론이라는 네 가지 주요 영역에서 쿼리, 궤적, 그리고 검증 가능한 답변의 구축에 초점을 맞춥니다. 또한, 에이전트의 견고성과 성능을 향상시키기 위한 에이전트 테스트 시간 반영 및 투표 전략을 탐구합니다. 우리는 Cognitive Kernel-Pro를 GAIA에서 평가하여 오픈소스 및 무료 에이전트 중 최첨단 결과를 달성했습니다. 특히, 우리의 8B 파라미터 오픈소스 모델은 WebDancer와 WebSailor와 같은 이전의 선두 시스템을 능가하며, 접근 가능한 고성능 AI 에이전트를 위한 새로운 성능 기준을 확립했습니다. 코드는 https://github.com/Tencent/CognitiveKernel-Pro에서 확인할 수 있습니다.
English
General AI Agents are increasingly recognized as foundational frameworks for
the next generation of artificial intelligence, enabling complex reasoning, web
interaction, coding, and autonomous research capabilities. However, current
agent systems are either closed-source or heavily reliant on a variety of paid
APIs and proprietary tools, limiting accessibility and reproducibility for the
research community. In this work, we present Cognitive Kernel-Pro, a
fully open-source and (to the maximum extent) free multi-module agent framework
designed to democratize the development and evaluation of advanced AI agents.
Within Cognitive Kernel-Pro, we systematically investigate the curation of
high-quality training data for Agent Foundation Models, focusing on the
construction of queries, trajectories, and verifiable answers across four key
domains: web, file, code, and general reasoning. Furthermore, we explore novel
strategies for agent test-time reflection and voting to enhance agent
robustness and performance. We evaluate Cognitive Kernel-Pro on GAIA, achieving
state-of-the-art results among open-source and free agents. Notably, our
8B-parameter open-source model surpasses previous leading systems such as
WebDancer and WebSailor, establishing a new performance standard for
accessible, high-capability AI agents. Code is available at
https://github.com/Tencent/CognitiveKernel-Pro