Alita: Agente Generalista que Possibilita Raciocínio Agêntico Escalável com Mínima Pré-definição e Máxima Auto-evolução

Resumo

Os recentes avanços em modelos de linguagem de grande escala (LLMs) permitiram que agentes realizassem tarefas complexas e de natureza aberta de forma autônoma. No entanto, muitos frameworks existentes dependem fortemente de ferramentas e fluxos de trabalho predefinidos manualmente, o que limita sua adaptabilidade, escalabilidade e generalização entre domínios. Neste trabalho, apresentamos Alita—um agente generalista projetado com o princípio de "A simplicidade é o último grau de sofisticação", permitindo raciocínio agentivo escalável por meio de pré-definição mínima e auto-evolução máxima. Para a pré-definição mínima, o Alita é equipado com apenas um componente para resolução direta de problemas, tornando-o muito mais simples e organizado do que abordagens anteriores que dependiam fortemente de ferramentas e fluxos de trabalho elaborados e manuais. Esse design limpo aumenta seu potencial de generalização para questões desafiadoras, sem ser limitado por ferramentas. Para a auto-evolução máxima, habilitamos a criatividade do Alita fornecendo um conjunto de componentes de propósito geral para construir, refinar e reutilizar capacidades externas de forma autônoma, gerando protocolos de contexto de modelo (MCPs) relacionados a tarefas a partir de fontes abertas, o que contribui para o raciocínio agentivo escalável. Notavelmente, o Alita alcança 75,15% de precisão pass@1 e 87,27% pass@3, posicionando-se entre os melhores agentes de propósito geral no conjunto de dados de validação do benchmark GAIA, e 74,00% e 52,00% pass@1, respectivamente, em Mathvista e PathVQA, superando muitos sistemas de agentes com complexidade muito maior. Mais detalhes serão atualizados em https://github.com/CharlesQ9/Alita{https://github.com/CharlesQ9/Alita}.

English

Recent advances in large language models (LLMs) have enabled agents to autonomously perform complex, open-ended tasks. However, many existing frameworks depend heavily on manually predefined tools and workflows, which hinder their adaptability, scalability, and generalization across domains. In this work, we introduce Alita--a generalist agent designed with the principle of "Simplicity is the ultimate sophistication," enabling scalable agentic reasoning through minimal predefinition and maximal self-evolution. For minimal predefinition, Alita is equipped with only one component for direct problem-solving, making it much simpler and neater than previous approaches that relied heavily on hand-crafted, elaborate tools and workflows. This clean design enhances its potential to generalize to challenging questions, without being limited by tools. For Maximal self-evolution, we enable the creativity of Alita by providing a suite of general-purpose components to autonomously construct, refine, and reuse external capabilities by generating task-related model context protocols (MCPs) from open source, which contributes to scalable agentic reasoning. Notably, Alita achieves 75.15% pass@1 and 87.27% pass@3 accuracy, which is top-ranking among general-purpose agents, on the GAIA benchmark validation dataset, 74.00% and 52.00% pass@1, respectively, on Mathvista and PathVQA, outperforming many agent systems with far greater complexity. More details will be updated at https://github.com/CharlesQ9/Alita{https://github.com/CharlesQ9/Alita}.

Alita: Agente Generalista que Possibilita Raciocínio Agêntico Escalável com Mínima Pré-definição e Máxima Auto-evolução

Alita: Generalist Agent Enabling Scalable Agentic Reasoning with Minimal Predefinition and Maximal Self-Evolution

Resumo

Support