ChatPaper.aiChatPaper

Alita: Agente Generalista que Permite Razonamiento Agéntico Escalable con Mínima Predefinición y Máxima Autoevolución

Alita: Generalist Agent Enabling Scalable Agentic Reasoning with Minimal Predefinition and Maximal Self-Evolution

May 26, 2025
Autores: Jiahao Qiu, Xuan Qi, Tongcheng Zhang, Xinzhe Juan, Jiacheng Guo, Yifu Lu, Yimin Wang, Zixin Yao, Qihan Ren, Xun Jiang, Xing Zhou, Dongrui Liu, Ling Yang, Yue Wu, Kaixuan Huang, Shilong Liu, Hongru Wang, Mengdi Wang
cs.AI

Resumen

Los recientes avances en los modelos de lenguaje de gran escala (LLMs, por sus siglas en inglés) han permitido que los agentes realicen tareas complejas y abiertas de manera autónoma. Sin embargo, muchos de los marcos existentes dependen en gran medida de herramientas y flujos de trabajo predefinidos manualmente, lo que limita su adaptabilidad, escalabilidad y generalización entre dominios. En este trabajo, presentamos Alita, un agente generalista diseñado bajo el principio de "La simplicidad es la máxima sofisticación", que permite un razonamiento agéntico escalable mediante una predefinición mínima y una autoevolución máxima. Para la predefinición mínima, Alita está equipado con un solo componente para la resolución directa de problemas, lo que lo hace mucho más simple y limpio que enfoques anteriores que dependían en gran medida de herramientas y flujos de trabajo elaborados y diseñados manualmente. Este diseño limpio mejora su potencial para generalizar en preguntas desafiantes, sin estar limitado por herramientas. Para la autoevolución máxima, potenciamos la creatividad de Alita proporcionando un conjunto de componentes de propósito general para construir, refinar y reutilizar capacidades externas de manera autónoma, generando protocolos de contexto de modelo (MCPs, por sus siglas en inglés) relacionados con tareas a partir de fuentes abiertas, lo que contribuye a un razonamiento agéntico escalable. Cabe destacar que Alita alcanza un 75.15% en pass@1 y un 87.27% en pass@3 en precisión, situándose entre los mejores agentes de propósito general en el conjunto de datos de validación del benchmark GAIA, y un 74.00% y 52.00% en pass@1, respectivamente, en Mathvista y PathVQA, superando a muchos sistemas de agentes con una complejidad mucho mayor. Más detalles se actualizarán en https://github.com/CharlesQ9/Alita{https://github.com/CharlesQ9/Alita}.
English
Recent advances in large language models (LLMs) have enabled agents to autonomously perform complex, open-ended tasks. However, many existing frameworks depend heavily on manually predefined tools and workflows, which hinder their adaptability, scalability, and generalization across domains. In this work, we introduce Alita--a generalist agent designed with the principle of "Simplicity is the ultimate sophistication," enabling scalable agentic reasoning through minimal predefinition and maximal self-evolution. For minimal predefinition, Alita is equipped with only one component for direct problem-solving, making it much simpler and neater than previous approaches that relied heavily on hand-crafted, elaborate tools and workflows. This clean design enhances its potential to generalize to challenging questions, without being limited by tools. For Maximal self-evolution, we enable the creativity of Alita by providing a suite of general-purpose components to autonomously construct, refine, and reuse external capabilities by generating task-related model context protocols (MCPs) from open source, which contributes to scalable agentic reasoning. Notably, Alita achieves 75.15% pass@1 and 87.27% pass@3 accuracy, which is top-ranking among general-purpose agents, on the GAIA benchmark validation dataset, 74.00% and 52.00% pass@1, respectively, on Mathvista and PathVQA, outperforming many agent systems with far greater complexity. More details will be updated at https://github.com/CharlesQ9/Alita{https://github.com/CharlesQ9/Alita}.

Summary

AI-Generated Summary

PDF64May 28, 2025