Alita: Agente Generalista que Permite Razonamiento Agéntico Escalable con Mínima Predefinición y Máxima Autoevolución
Alita: Generalist Agent Enabling Scalable Agentic Reasoning with Minimal Predefinition and Maximal Self-Evolution
May 26, 2025
Autores: Jiahao Qiu, Xuan Qi, Tongcheng Zhang, Xinzhe Juan, Jiacheng Guo, Yifu Lu, Yimin Wang, Zixin Yao, Qihan Ren, Xun Jiang, Xing Zhou, Dongrui Liu, Ling Yang, Yue Wu, Kaixuan Huang, Shilong Liu, Hongru Wang, Mengdi Wang
cs.AI
Resumen
Los recientes avances en los modelos de lenguaje de gran escala (LLMs, por sus siglas en inglés) han permitido que los agentes realicen tareas complejas y abiertas de manera autónoma. Sin embargo, muchos de los marcos existentes dependen en gran medida de herramientas y flujos de trabajo predefinidos manualmente, lo que limita su adaptabilidad, escalabilidad y generalización entre dominios. En este trabajo, presentamos Alita, un agente generalista diseñado bajo el principio de "La simplicidad es la máxima sofisticación", que permite un razonamiento agéntico escalable mediante una predefinición mínima y una autoevolución máxima. Para la predefinición mínima, Alita está equipado con un solo componente para la resolución directa de problemas, lo que lo hace mucho más simple y limpio que enfoques anteriores que dependían en gran medida de herramientas y flujos de trabajo elaborados y diseñados manualmente. Este diseño limpio mejora su potencial para generalizar en preguntas desafiantes, sin estar limitado por herramientas. Para la autoevolución máxima, potenciamos la creatividad de Alita proporcionando un conjunto de componentes de propósito general para construir, refinar y reutilizar capacidades externas de manera autónoma, generando protocolos de contexto de modelo (MCPs, por sus siglas en inglés) relacionados con tareas a partir de fuentes abiertas, lo que contribuye a un razonamiento agéntico escalable. Cabe destacar que Alita alcanza un 75.15% en pass@1 y un 87.27% en pass@3 en precisión, situándose entre los mejores agentes de propósito general en el conjunto de datos de validación del benchmark GAIA, y un 74.00% y 52.00% en pass@1, respectivamente, en Mathvista y PathVQA, superando a muchos sistemas de agentes con una complejidad mucho mayor. Más detalles se actualizarán en https://github.com/CharlesQ9/Alita{https://github.com/CharlesQ9/Alita}.
English
Recent advances in large language models (LLMs) have enabled agents to
autonomously perform complex, open-ended tasks. However, many existing
frameworks depend heavily on manually predefined tools and workflows, which
hinder their adaptability, scalability, and generalization across domains. In
this work, we introduce Alita--a generalist agent designed with the principle
of "Simplicity is the ultimate sophistication," enabling scalable agentic
reasoning through minimal predefinition and maximal self-evolution. For minimal
predefinition, Alita is equipped with only one component for direct
problem-solving, making it much simpler and neater than previous approaches
that relied heavily on hand-crafted, elaborate tools and workflows. This clean
design enhances its potential to generalize to challenging questions, without
being limited by tools. For Maximal self-evolution, we enable the creativity of
Alita by providing a suite of general-purpose components to autonomously
construct, refine, and reuse external capabilities by generating task-related
model context protocols (MCPs) from open source, which contributes to scalable
agentic reasoning. Notably, Alita achieves 75.15% pass@1 and 87.27% pass@3
accuracy, which is top-ranking among general-purpose agents, on the GAIA
benchmark validation dataset, 74.00% and 52.00% pass@1, respectively, on
Mathvista and PathVQA, outperforming many agent systems with far greater
complexity. More details will be updated at
https://github.com/CharlesQ9/Alita{https://github.com/CharlesQ9/Alita}.Summary
AI-Generated Summary