Cognitive Kernel-Pro: Фреймворк для глубоких исследовательских агентов и обучения базовых моделей агентов
Cognitive Kernel-Pro: A Framework for Deep Research Agents and Agent Foundation Models Training
August 1, 2025
Авторы: Tianqing Fang, Zhisong Zhang, Xiaoyang Wang, Rui Wang, Can Qin, Yuxuan Wan, Jun-Yu Ma, Ce Zhang, Jiaqi Chen, Xiyun Li, Hongming Zhang, Haitao Mi, Dong Yu
cs.AI
Аннотация
Общие ИИ-агенты всё чаще признаются фундаментальными фреймворками для следующего поколения искусственного интеллекта, обеспечивая сложные рассуждения, взаимодействие с вебом, программирование и автономные исследовательские возможности. Однако современные системы агентов либо являются закрытыми, либо сильно зависят от множества платных API и проприетарных инструментов, что ограничивает доступность и воспроизводимость для исследовательского сообщества. В данной работе мы представляем Cognitive Kernel-Pro — полностью открытый и (в максимальной степени) бесплатный многомодульный фреймворк для агентов, разработанный для демократизации разработки и оценки продвинутых ИИ-агентов. В рамках Cognitive Kernel-Pro мы систематически исследуем подготовку высококачественных обучающих данных для базовых моделей агентов, уделяя особое внимание построению запросов, траекторий и проверяемых ответов в четырёх ключевых областях: веб, файлы, код и общие рассуждения. Кроме того, мы исследуем новые стратегии для рефлексии и голосования агентов во время тестирования, чтобы повысить их устойчивость и производительность. Мы оцениваем Cognitive Kernel-Pro на GAIA, достигая передовых результатов среди открытых и бесплатных агентов. Примечательно, что наша открытая модель с 8 миллиардами параметров превосходит предыдущие ведущие системы, такие как WebDancer и WebSailor, устанавливая новый стандарт производительности для доступных и высокопроизводительных ИИ-агентов. Код доступен по адресу https://github.com/Tencent/CognitiveKernel-Pro.
English
General AI Agents are increasingly recognized as foundational frameworks for
the next generation of artificial intelligence, enabling complex reasoning, web
interaction, coding, and autonomous research capabilities. However, current
agent systems are either closed-source or heavily reliant on a variety of paid
APIs and proprietary tools, limiting accessibility and reproducibility for the
research community. In this work, we present Cognitive Kernel-Pro, a
fully open-source and (to the maximum extent) free multi-module agent framework
designed to democratize the development and evaluation of advanced AI agents.
Within Cognitive Kernel-Pro, we systematically investigate the curation of
high-quality training data for Agent Foundation Models, focusing on the
construction of queries, trajectories, and verifiable answers across four key
domains: web, file, code, and general reasoning. Furthermore, we explore novel
strategies for agent test-time reflection and voting to enhance agent
robustness and performance. We evaluate Cognitive Kernel-Pro on GAIA, achieving
state-of-the-art results among open-source and free agents. Notably, our
8B-parameter open-source model surpasses previous leading systems such as
WebDancer and WebSailor, establishing a new performance standard for
accessible, high-capability AI agents. Code is available at
https://github.com/Tencent/CognitiveKernel-Pro