ChatPaper.aiChatPaper

Alita: Agente Generalista que Possibilita Raciocínio Agêntico Escalável com Mínima Pré-definição e Máxima Auto-evolução

Alita: Generalist Agent Enabling Scalable Agentic Reasoning with Minimal Predefinition and Maximal Self-Evolution

May 26, 2025
Autores: Jiahao Qiu, Xuan Qi, Tongcheng Zhang, Xinzhe Juan, Jiacheng Guo, Yifu Lu, Yimin Wang, Zixin Yao, Qihan Ren, Xun Jiang, Xing Zhou, Dongrui Liu, Ling Yang, Yue Wu, Kaixuan Huang, Shilong Liu, Hongru Wang, Mengdi Wang
cs.AI

Resumo

Os recentes avanços em modelos de linguagem de grande escala (LLMs) permitiram que agentes realizassem tarefas complexas e de natureza aberta de forma autônoma. No entanto, muitos frameworks existentes dependem fortemente de ferramentas e fluxos de trabalho predefinidos manualmente, o que limita sua adaptabilidade, escalabilidade e generalização entre domínios. Neste trabalho, apresentamos Alita—um agente generalista projetado com o princípio de "A simplicidade é o último grau de sofisticação", permitindo raciocínio agentivo escalável por meio de pré-definição mínima e auto-evolução máxima. Para a pré-definição mínima, o Alita é equipado com apenas um componente para resolução direta de problemas, tornando-o muito mais simples e organizado do que abordagens anteriores que dependiam fortemente de ferramentas e fluxos de trabalho elaborados e manuais. Esse design limpo aumenta seu potencial de generalização para questões desafiadoras, sem ser limitado por ferramentas. Para a auto-evolução máxima, habilitamos a criatividade do Alita fornecendo um conjunto de componentes de propósito geral para construir, refinar e reutilizar capacidades externas de forma autônoma, gerando protocolos de contexto de modelo (MCPs) relacionados a tarefas a partir de fontes abertas, o que contribui para o raciocínio agentivo escalável. Notavelmente, o Alita alcança 75,15% de precisão pass@1 e 87,27% pass@3, posicionando-se entre os melhores agentes de propósito geral no conjunto de dados de validação do benchmark GAIA, e 74,00% e 52,00% pass@1, respectivamente, em Mathvista e PathVQA, superando muitos sistemas de agentes com complexidade muito maior. Mais detalhes serão atualizados em https://github.com/CharlesQ9/Alita{https://github.com/CharlesQ9/Alita}.
English
Recent advances in large language models (LLMs) have enabled agents to autonomously perform complex, open-ended tasks. However, many existing frameworks depend heavily on manually predefined tools and workflows, which hinder their adaptability, scalability, and generalization across domains. In this work, we introduce Alita--a generalist agent designed with the principle of "Simplicity is the ultimate sophistication," enabling scalable agentic reasoning through minimal predefinition and maximal self-evolution. For minimal predefinition, Alita is equipped with only one component for direct problem-solving, making it much simpler and neater than previous approaches that relied heavily on hand-crafted, elaborate tools and workflows. This clean design enhances its potential to generalize to challenging questions, without being limited by tools. For Maximal self-evolution, we enable the creativity of Alita by providing a suite of general-purpose components to autonomously construct, refine, and reuse external capabilities by generating task-related model context protocols (MCPs) from open source, which contributes to scalable agentic reasoning. Notably, Alita achieves 75.15% pass@1 and 87.27% pass@3 accuracy, which is top-ranking among general-purpose agents, on the GAIA benchmark validation dataset, 74.00% and 52.00% pass@1, respectively, on Mathvista and PathVQA, outperforming many agent systems with far greater complexity. More details will be updated at https://github.com/CharlesQ9/Alita{https://github.com/CharlesQ9/Alita}.
PDF84December 4, 2025