ChatPaper.aiChatPaper

Alita : Agent généraliste permettant un raisonnement agentif évolutif avec une prédéfinition minimale et une auto-évolution maximale

Alita: Generalist Agent Enabling Scalable Agentic Reasoning with Minimal Predefinition and Maximal Self-Evolution

May 26, 2025
Auteurs: Jiahao Qiu, Xuan Qi, Tongcheng Zhang, Xinzhe Juan, Jiacheng Guo, Yifu Lu, Yimin Wang, Zixin Yao, Qihan Ren, Xun Jiang, Xing Zhou, Dongrui Liu, Ling Yang, Yue Wu, Kaixuan Huang, Shilong Liu, Hongru Wang, Mengdi Wang
cs.AI

Résumé

Les récents progrès des grands modèles de langage (LLMs) ont permis à des agents d'exécuter de manière autonome des tâches complexes et ouvertes. Cependant, de nombreux frameworks existants dépendent fortement d'outils et de workflows prédéfinis manuellement, ce qui limite leur adaptabilité, leur évolutivité et leur généralisation à travers différents domaines. Dans ce travail, nous présentons Alita—un agent généraliste conçu selon le principe "La simplicité est la sophistication ultime", permettant un raisonnement agentique évolutif grâce à une prédéfinition minimale et une auto-évolution maximale. Pour une prédéfinition minimale, Alita est équipé d'un seul composant pour la résolution directe de problèmes, le rendant beaucoup plus simple et épuré que les approches précédentes qui reposaient fortement sur des outils et workflows élaborés et conçus manuellement. Cette conception épurée améliore son potentiel à généraliser des questions complexes, sans être limité par des outils. Pour une auto-évolution maximale, nous favorisons la créativité d'Alita en fournissant une suite de composants polyvalents pour construire, affiner et réutiliser de manière autonome des capacités externes en générant des protocoles de contexte de modèle (MCPs) liés aux tâches à partir de sources ouvertes, ce qui contribue à un raisonnement agentique évolutif. Notamment, Alita atteint une précision de 75,15 % pass@1 et 87,27 % pass@3, ce qui le place parmi les meilleurs agents polyvalents sur le jeu de données de validation du benchmark GAIA, et respectivement 74,00 % et 52,00 % pass@1 sur Mathvista et PathVQA, surpassant de nombreux systèmes d'agents bien plus complexes. Plus de détails seront mis à jour sur https://github.com/CharlesQ9/Alita{https://github.com/CharlesQ9/Alita}.
English
Recent advances in large language models (LLMs) have enabled agents to autonomously perform complex, open-ended tasks. However, many existing frameworks depend heavily on manually predefined tools and workflows, which hinder their adaptability, scalability, and generalization across domains. In this work, we introduce Alita--a generalist agent designed with the principle of "Simplicity is the ultimate sophistication," enabling scalable agentic reasoning through minimal predefinition and maximal self-evolution. For minimal predefinition, Alita is equipped with only one component for direct problem-solving, making it much simpler and neater than previous approaches that relied heavily on hand-crafted, elaborate tools and workflows. This clean design enhances its potential to generalize to challenging questions, without being limited by tools. For Maximal self-evolution, we enable the creativity of Alita by providing a suite of general-purpose components to autonomously construct, refine, and reuse external capabilities by generating task-related model context protocols (MCPs) from open source, which contributes to scalable agentic reasoning. Notably, Alita achieves 75.15% pass@1 and 87.27% pass@3 accuracy, which is top-ranking among general-purpose agents, on the GAIA benchmark validation dataset, 74.00% and 52.00% pass@1, respectively, on Mathvista and PathVQA, outperforming many agent systems with far greater complexity. More details will be updated at https://github.com/CharlesQ9/Alita{https://github.com/CharlesQ9/Alita}.

Summary

AI-Generated Summary

PDF64May 28, 2025