Alita : Agent généraliste permettant un raisonnement agentif évolutif avec une prédéfinition minimale et une auto-évolution maximale
Alita: Generalist Agent Enabling Scalable Agentic Reasoning with Minimal Predefinition and Maximal Self-Evolution
May 26, 2025
Auteurs: Jiahao Qiu, Xuan Qi, Tongcheng Zhang, Xinzhe Juan, Jiacheng Guo, Yifu Lu, Yimin Wang, Zixin Yao, Qihan Ren, Xun Jiang, Xing Zhou, Dongrui Liu, Ling Yang, Yue Wu, Kaixuan Huang, Shilong Liu, Hongru Wang, Mengdi Wang
cs.AI
Résumé
Les récents progrès des grands modèles de langage (LLMs) ont permis à des agents d'exécuter de manière autonome des tâches complexes et ouvertes. Cependant, de nombreux frameworks existants dépendent fortement d'outils et de workflows prédéfinis manuellement, ce qui limite leur adaptabilité, leur évolutivité et leur généralisation à travers différents domaines. Dans ce travail, nous présentons Alita—un agent généraliste conçu selon le principe "La simplicité est la sophistication ultime", permettant un raisonnement agentique évolutif grâce à une prédéfinition minimale et une auto-évolution maximale. Pour une prédéfinition minimale, Alita est équipé d'un seul composant pour la résolution directe de problèmes, le rendant beaucoup plus simple et épuré que les approches précédentes qui reposaient fortement sur des outils et workflows élaborés et conçus manuellement. Cette conception épurée améliore son potentiel à généraliser des questions complexes, sans être limité par des outils. Pour une auto-évolution maximale, nous favorisons la créativité d'Alita en fournissant une suite de composants polyvalents pour construire, affiner et réutiliser de manière autonome des capacités externes en générant des protocoles de contexte de modèle (MCPs) liés aux tâches à partir de sources ouvertes, ce qui contribue à un raisonnement agentique évolutif. Notamment, Alita atteint une précision de 75,15 % pass@1 et 87,27 % pass@3, ce qui le place parmi les meilleurs agents polyvalents sur le jeu de données de validation du benchmark GAIA, et respectivement 74,00 % et 52,00 % pass@1 sur Mathvista et PathVQA, surpassant de nombreux systèmes d'agents bien plus complexes. Plus de détails seront mis à jour sur https://github.com/CharlesQ9/Alita{https://github.com/CharlesQ9/Alita}.
English
Recent advances in large language models (LLMs) have enabled agents to
autonomously perform complex, open-ended tasks. However, many existing
frameworks depend heavily on manually predefined tools and workflows, which
hinder their adaptability, scalability, and generalization across domains. In
this work, we introduce Alita--a generalist agent designed with the principle
of "Simplicity is the ultimate sophistication," enabling scalable agentic
reasoning through minimal predefinition and maximal self-evolution. For minimal
predefinition, Alita is equipped with only one component for direct
problem-solving, making it much simpler and neater than previous approaches
that relied heavily on hand-crafted, elaborate tools and workflows. This clean
design enhances its potential to generalize to challenging questions, without
being limited by tools. For Maximal self-evolution, we enable the creativity of
Alita by providing a suite of general-purpose components to autonomously
construct, refine, and reuse external capabilities by generating task-related
model context protocols (MCPs) from open source, which contributes to scalable
agentic reasoning. Notably, Alita achieves 75.15% pass@1 and 87.27% pass@3
accuracy, which is top-ranking among general-purpose agents, on the GAIA
benchmark validation dataset, 74.00% and 52.00% pass@1, respectively, on
Mathvista and PathVQA, outperforming many agent systems with far greater
complexity. More details will be updated at
https://github.com/CharlesQ9/Alita{https://github.com/CharlesQ9/Alita}.Summary
AI-Generated Summary