AgentGym: Evolución de agentes basados en modelos de lenguaje de gran escala a través de diversos entornos

Resumen

Construir agentes generalistas capaces de manejar diversas tareas y evolucionar en diferentes entornos es un objetivo a largo plazo en la comunidad de IA. Los modelos de lenguaje grandes (LLMs, por sus siglas en inglés) se consideran una base prometedora para construir dichos agentes debido a sus capacidades generalizadas. Los enfoques actuales hacen que los agentes basados en LLM imiten trayectorias proporcionadas por expertos paso a paso, lo que requiere supervisión humana, dificulta la escalabilidad y limita la exploración del entorno; o permiten que los agentes exploren y aprendan en entornos aislados, lo que resulta en agentes especializados con una generalización limitada. En este artículo, damos el primer paso hacia la construcción de agentes basados en LLM con capacidad general y habilidad de auto-evolución. Identificamos una tríada de ingredientes clave: 1) entornos diversos para la exploración y aprendizaje del agente, 2) un conjunto de trayectorias para equipar a los agentes con capacidades básicas y conocimiento previo, y 3) un método de evolución efectivo y escalable. Proponemos AgentGym, un nuevo marco que incluye una variedad de entornos y tareas para una exploración amplia, en tiempo real, unificada y concurrente de los agentes. AgentGym también incluye una base de datos con instrucciones ampliadas, un conjunto de benchmarks y trayectorias de alta calidad en múltiples entornos. A continuación, proponemos un método novedoso, AgentEvol, para investigar el potencial de la auto-evolución de los agentes más allá de los datos previamente vistos en tareas y entornos. Los resultados experimentales muestran que los agentes evolucionados pueden alcanzar resultados comparables a los modelos de última generación (SOTA). Publicamos el conjunto AgentGym, que incluye la plataforma, el conjunto de datos, los benchmarks, los puntos de control y las implementaciones de los algoritmos. El conjunto AgentGym está disponible en https://github.com/WooooDyy/AgentGym.

English

Building generalist agents that can handle diverse tasks and evolve themselves across different environments is a long-term goal in the AI community. Large language models (LLMs) are considered a promising foundation to build such agents due to their generalized capabilities. Current approaches either have LLM-based agents imitate expert-provided trajectories step-by-step, requiring human supervision, which is hard to scale and limits environmental exploration; or they let agents explore and learn in isolated environments, resulting in specialist agents with limited generalization. In this paper, we take the first step towards building generally-capable LLM-based agents with self-evolution ability. We identify a trinity of ingredients: 1) diverse environments for agent exploration and learning, 2) a trajectory set to equip agents with basic capabilities and prior knowledge, and 3) an effective and scalable evolution method. We propose AgentGym, a new framework featuring a variety of environments and tasks for broad, real-time, uni-format, and concurrent agent exploration. AgentGym also includes a database with expanded instructions, a benchmark suite, and high-quality trajectories across environments. Next, we propose a novel method, AgentEvol, to investigate the potential of agent self-evolution beyond previously seen data across tasks and environments. Experimental results show that the evolved agents can achieve results comparable to SOTA models. We release the AgentGym suite, including the platform, dataset, benchmark, checkpoints, and algorithm implementations. The AgentGym suite is available on https://github.com/WooooDyy/AgentGym.

AgentGym: Evolución de agentes basados en modelos de lenguaje de gran escala a través de diversos entornos

AgentGym: Evolving Large Language Model-based Agents across Diverse Environments

Resumen

Support