Alita: Agente Generalista che Abilita il Ragionamento Agente Scalabile con Predefinizione Minima e Auto-Evoluzione Massima
Alita: Generalist Agent Enabling Scalable Agentic Reasoning with Minimal Predefinition and Maximal Self-Evolution
May 26, 2025
Autori: Jiahao Qiu, Xuan Qi, Tongcheng Zhang, Xinzhe Juan, Jiacheng Guo, Yifu Lu, Yimin Wang, Zixin Yao, Qihan Ren, Xun Jiang, Xing Zhou, Dongrui Liu, Ling Yang, Yue Wu, Kaixuan Huang, Shilong Liu, Hongru Wang, Mengdi Wang
cs.AI
Abstract
I recenti progressi nei modelli linguistici di grandi dimensioni (LLM) hanno consentito agli agenti di eseguire autonomamente compiti complessi e aperti. Tuttavia, molti framework esistenti dipendono fortemente da strumenti e flussi di lavoro predefiniti manualmente, il che ne ostacola l'adattabilità, la scalabilità e la generalizzazione tra i domini. In questo lavoro, introduciamo Alita—un agente generalista progettato con il principio "La semplicità è la massima sofisticazione", che abilita un ragionamento agentivo scalabile attraverso una predefinizione minima e una massima auto-evoluzione. Per la predefinizione minima, Alita è dotato di un solo componente per la risoluzione diretta dei problemi, rendendolo molto più semplice e lineare rispetto agli approcci precedenti che si basavano pesantemente su strumenti e flussi di lavoro elaborati e creati manualmente. Questo design pulito ne aumenta il potenziale di generalizzazione a domande complesse, senza essere limitato dagli strumenti. Per la massima auto-evoluzione, abilitiamo la creatività di Alita fornendo una suite di componenti generici per costruire, affinare e riutilizzare autonomamente capacità esterne generando protocolli di contesto del modello (MCP) relativi ai task da fonti open source, contribuendo così a un ragionamento agentivo scalabile. In particolare, Alita raggiunge un'accuratezza del 75,15% in pass@1 e dell'87,27% in pass@3, posizionandosi ai vertici tra gli agenti general-purpose, sul dataset di validazione del benchmark GAIA, e rispettivamente il 74,00% e il 52,00% in pass@1 su Mathvista e PathVQA, superando molti sistemi agentivi con una complessità molto maggiore. Ulteriori dettagli saranno aggiornati su https://github.com/CharlesQ9/Alita{https://github.com/CharlesQ9/Alita}.
English
Recent advances in large language models (LLMs) have enabled agents to
autonomously perform complex, open-ended tasks. However, many existing
frameworks depend heavily on manually predefined tools and workflows, which
hinder their adaptability, scalability, and generalization across domains. In
this work, we introduce Alita--a generalist agent designed with the principle
of "Simplicity is the ultimate sophistication," enabling scalable agentic
reasoning through minimal predefinition and maximal self-evolution. For minimal
predefinition, Alita is equipped with only one component for direct
problem-solving, making it much simpler and neater than previous approaches
that relied heavily on hand-crafted, elaborate tools and workflows. This clean
design enhances its potential to generalize to challenging questions, without
being limited by tools. For Maximal self-evolution, we enable the creativity of
Alita by providing a suite of general-purpose components to autonomously
construct, refine, and reuse external capabilities by generating task-related
model context protocols (MCPs) from open source, which contributes to scalable
agentic reasoning. Notably, Alita achieves 75.15% pass@1 and 87.27% pass@3
accuracy, which is top-ranking among general-purpose agents, on the GAIA
benchmark validation dataset, 74.00% and 52.00% pass@1, respectively, on
Mathvista and PathVQA, outperforming many agent systems with far greater
complexity. More details will be updated at
https://github.com/CharlesQ9/Alita{https://github.com/CharlesQ9/Alita}.