Alita: Agente Generalista che Abilita il Ragionamento Agente Scalabile con Predefinizione Minima e Auto-Evoluzione Massima

Abstract

I recenti progressi nei modelli linguistici di grandi dimensioni (LLM) hanno consentito agli agenti di eseguire autonomamente compiti complessi e aperti. Tuttavia, molti framework esistenti dipendono fortemente da strumenti e flussi di lavoro predefiniti manualmente, il che ne ostacola l'adattabilità, la scalabilità e la generalizzazione tra i domini. In questo lavoro, introduciamo Alita—un agente generalista progettato con il principio "La semplicità è la massima sofisticazione", che abilita un ragionamento agentivo scalabile attraverso una predefinizione minima e una massima auto-evoluzione. Per la predefinizione minima, Alita è dotato di un solo componente per la risoluzione diretta dei problemi, rendendolo molto più semplice e lineare rispetto agli approcci precedenti che si basavano pesantemente su strumenti e flussi di lavoro elaborati e creati manualmente. Questo design pulito ne aumenta il potenziale di generalizzazione a domande complesse, senza essere limitato dagli strumenti. Per la massima auto-evoluzione, abilitiamo la creatività di Alita fornendo una suite di componenti generici per costruire, affinare e riutilizzare autonomamente capacità esterne generando protocolli di contesto del modello (MCP) relativi ai task da fonti open source, contribuendo così a un ragionamento agentivo scalabile. In particolare, Alita raggiunge un'accuratezza del 75,15% in pass@1 e dell'87,27% in pass@3, posizionandosi ai vertici tra gli agenti general-purpose, sul dataset di validazione del benchmark GAIA, e rispettivamente il 74,00% e il 52,00% in pass@1 su Mathvista e PathVQA, superando molti sistemi agentivi con una complessità molto maggiore. Ulteriori dettagli saranno aggiornati su https://github.com/CharlesQ9/Alita{https://github.com/CharlesQ9/Alita}.

English

Recent advances in large language models (LLMs) have enabled agents to autonomously perform complex, open-ended tasks. However, many existing frameworks depend heavily on manually predefined tools and workflows, which hinder their adaptability, scalability, and generalization across domains. In this work, we introduce Alita--a generalist agent designed with the principle of "Simplicity is the ultimate sophistication," enabling scalable agentic reasoning through minimal predefinition and maximal self-evolution. For minimal predefinition, Alita is equipped with only one component for direct problem-solving, making it much simpler and neater than previous approaches that relied heavily on hand-crafted, elaborate tools and workflows. This clean design enhances its potential to generalize to challenging questions, without being limited by tools. For Maximal self-evolution, we enable the creativity of Alita by providing a suite of general-purpose components to autonomously construct, refine, and reuse external capabilities by generating task-related model context protocols (MCPs) from open source, which contributes to scalable agentic reasoning. Notably, Alita achieves 75.15% pass@1 and 87.27% pass@3 accuracy, which is top-ranking among general-purpose agents, on the GAIA benchmark validation dataset, 74.00% and 52.00% pass@1, respectively, on Mathvista and PathVQA, outperforming many agent systems with far greater complexity. More details will be updated at https://github.com/CharlesQ9/Alita{https://github.com/CharlesQ9/Alita}.

Alita: Agente Generalista che Abilita il Ragionamento Agente Scalabile con Predefinizione Minima e Auto-Evoluzione Massima

Alita: Generalist Agent Enabling Scalable Agentic Reasoning with Minimal Predefinition and Maximal Self-Evolution

Abstract

Support