ChatPaper.aiChatPaper

Cognitive Kernel-Pro: Фреймворк для глубоких исследовательских агентов и обучения базовых моделей агентов

Cognitive Kernel-Pro: A Framework for Deep Research Agents and Agent Foundation Models Training

August 1, 2025
Авторы: Tianqing Fang, Zhisong Zhang, Xiaoyang Wang, Rui Wang, Can Qin, Yuxuan Wan, Jun-Yu Ma, Ce Zhang, Jiaqi Chen, Xiyun Li, Hongming Zhang, Haitao Mi, Dong Yu
cs.AI

Аннотация

Общие ИИ-агенты всё чаще признаются фундаментальными фреймворками для следующего поколения искусственного интеллекта, обеспечивая сложные рассуждения, взаимодействие с вебом, программирование и автономные исследовательские возможности. Однако современные системы агентов либо являются закрытыми, либо сильно зависят от множества платных API и проприетарных инструментов, что ограничивает доступность и воспроизводимость для исследовательского сообщества. В данной работе мы представляем Cognitive Kernel-Pro — полностью открытый и (в максимальной степени) бесплатный многомодульный фреймворк для агентов, разработанный для демократизации разработки и оценки продвинутых ИИ-агентов. В рамках Cognitive Kernel-Pro мы систематически исследуем подготовку высококачественных обучающих данных для базовых моделей агентов, уделяя особое внимание построению запросов, траекторий и проверяемых ответов в четырёх ключевых областях: веб, файлы, код и общие рассуждения. Кроме того, мы исследуем новые стратегии для рефлексии и голосования агентов во время тестирования, чтобы повысить их устойчивость и производительность. Мы оцениваем Cognitive Kernel-Pro на GAIA, достигая передовых результатов среди открытых и бесплатных агентов. Примечательно, что наша открытая модель с 8 миллиардами параметров превосходит предыдущие ведущие системы, такие как WebDancer и WebSailor, устанавливая новый стандарт производительности для доступных и высокопроизводительных ИИ-агентов. Код доступен по адресу https://github.com/Tencent/CognitiveKernel-Pro.
English
General AI Agents are increasingly recognized as foundational frameworks for the next generation of artificial intelligence, enabling complex reasoning, web interaction, coding, and autonomous research capabilities. However, current agent systems are either closed-source or heavily reliant on a variety of paid APIs and proprietary tools, limiting accessibility and reproducibility for the research community. In this work, we present Cognitive Kernel-Pro, a fully open-source and (to the maximum extent) free multi-module agent framework designed to democratize the development and evaluation of advanced AI agents. Within Cognitive Kernel-Pro, we systematically investigate the curation of high-quality training data for Agent Foundation Models, focusing on the construction of queries, trajectories, and verifiable answers across four key domains: web, file, code, and general reasoning. Furthermore, we explore novel strategies for agent test-time reflection and voting to enhance agent robustness and performance. We evaluate Cognitive Kernel-Pro on GAIA, achieving state-of-the-art results among open-source and free agents. Notably, our 8B-parameter open-source model surpasses previous leading systems such as WebDancer and WebSailor, establishing a new performance standard for accessible, high-capability AI agents. Code is available at https://github.com/Tencent/CognitiveKernel-Pro
PDF792August 4, 2025