ChatPaper.aiChatPaper

Alita: Agente Generalista che Abilita il Ragionamento Agente Scalabile con Predefinizione Minima e Auto-Evoluzione Massima

Alita: Generalist Agent Enabling Scalable Agentic Reasoning with Minimal Predefinition and Maximal Self-Evolution

May 26, 2025
Autori: Jiahao Qiu, Xuan Qi, Tongcheng Zhang, Xinzhe Juan, Jiacheng Guo, Yifu Lu, Yimin Wang, Zixin Yao, Qihan Ren, Xun Jiang, Xing Zhou, Dongrui Liu, Ling Yang, Yue Wu, Kaixuan Huang, Shilong Liu, Hongru Wang, Mengdi Wang
cs.AI

Abstract

I recenti progressi nei modelli linguistici di grandi dimensioni (LLM) hanno consentito agli agenti di eseguire autonomamente compiti complessi e aperti. Tuttavia, molti framework esistenti dipendono fortemente da strumenti e flussi di lavoro predefiniti manualmente, il che ne ostacola l'adattabilità, la scalabilità e la generalizzazione tra i domini. In questo lavoro, introduciamo Alita—un agente generalista progettato con il principio "La semplicità è la massima sofisticazione", che abilita un ragionamento agentivo scalabile attraverso una predefinizione minima e una massima auto-evoluzione. Per la predefinizione minima, Alita è dotato di un solo componente per la risoluzione diretta dei problemi, rendendolo molto più semplice e lineare rispetto agli approcci precedenti che si basavano pesantemente su strumenti e flussi di lavoro elaborati e creati manualmente. Questo design pulito ne aumenta il potenziale di generalizzazione a domande complesse, senza essere limitato dagli strumenti. Per la massima auto-evoluzione, abilitiamo la creatività di Alita fornendo una suite di componenti generici per costruire, affinare e riutilizzare autonomamente capacità esterne generando protocolli di contesto del modello (MCP) relativi ai task da fonti open source, contribuendo così a un ragionamento agentivo scalabile. In particolare, Alita raggiunge un'accuratezza del 75,15% in pass@1 e dell'87,27% in pass@3, posizionandosi ai vertici tra gli agenti general-purpose, sul dataset di validazione del benchmark GAIA, e rispettivamente il 74,00% e il 52,00% in pass@1 su Mathvista e PathVQA, superando molti sistemi agentivi con una complessità molto maggiore. Ulteriori dettagli saranno aggiornati su https://github.com/CharlesQ9/Alita{https://github.com/CharlesQ9/Alita}.
English
Recent advances in large language models (LLMs) have enabled agents to autonomously perform complex, open-ended tasks. However, many existing frameworks depend heavily on manually predefined tools and workflows, which hinder their adaptability, scalability, and generalization across domains. In this work, we introduce Alita--a generalist agent designed with the principle of "Simplicity is the ultimate sophistication," enabling scalable agentic reasoning through minimal predefinition and maximal self-evolution. For minimal predefinition, Alita is equipped with only one component for direct problem-solving, making it much simpler and neater than previous approaches that relied heavily on hand-crafted, elaborate tools and workflows. This clean design enhances its potential to generalize to challenging questions, without being limited by tools. For Maximal self-evolution, we enable the creativity of Alita by providing a suite of general-purpose components to autonomously construct, refine, and reuse external capabilities by generating task-related model context protocols (MCPs) from open source, which contributes to scalable agentic reasoning. Notably, Alita achieves 75.15% pass@1 and 87.27% pass@3 accuracy, which is top-ranking among general-purpose agents, on the GAIA benchmark validation dataset, 74.00% and 52.00% pass@1, respectively, on Mathvista and PathVQA, outperforming many agent systems with far greater complexity. More details will be updated at https://github.com/CharlesQ9/Alita{https://github.com/CharlesQ9/Alita}.
PDF74May 28, 2025