ChatPaper.aiChatPaper

EnvX: Agenteize Tudo com IA Agente

EnvX: Agentize Everything with Agentic AI

September 9, 2025
Autores: Linyao Chen, Zimian Peng, Yingxuan Yang, Yikun Wang, Wenzheng Tom Tang, Hiroki H. Kobayashi, Weinan Zhang
cs.AI

Resumo

A ampla disponibilidade de repositórios de código aberto resultou em uma vasta coleção de componentes de software reutilizáveis, mas sua utilização ainda é manual, propensa a erros e desconectada. Desenvolvedores precisam navegar por documentações, entender APIs e escrever códigos de integração, criando barreiras significativas para a reutilização eficiente de software. Para abordar isso, apresentamos o EnvX, um framework que utiliza Inteligência Artificial Agente (Agentic AI) para transformar repositórios do GitHub em agentes inteligentes e autônomos, capazes de interagir por linguagem natural e colaborar entre si. Diferente das abordagens existentes que tratam repositórios como recursos de código estáticos, o EnvX os reimagina como agentes ativos por meio de um processo de três fases: (1) inicialização do ambiente guiada por TODO, que configura as dependências, dados e conjuntos de validação necessários; (2) automação agente alinhada ao humano, permitindo que agentes específicos do repositório realizem tarefas do mundo real de forma autônoma; e (3) protocolo Agente-para-Agente (A2A), que possibilita a colaboração entre múltiplos agentes. Ao combinar as capacidades de modelos de linguagem de grande escala com a integração estruturada de ferramentas, o EnvX automatiza não apenas a geração de código, mas todo o processo de compreensão, inicialização e operacionalização da funcionalidade do repositório. Avaliamos o EnvX no benchmark GitTaskBench, utilizando 18 repositórios de domínios como processamento de imagens, reconhecimento de fala, análise de documentos e manipulação de vídeo. Nossos resultados mostram que o EnvX alcança uma taxa de conclusão de execução de 74,07% e uma taxa de aprovação de tarefas de 51,85%, superando frameworks existentes. Estudos de caso demonstram ainda a capacidade do EnvX de permitir colaboração entre múltiplos repositórios por meio do protocolo A2A. Este trabalho marca uma mudança de tratar repositórios como recursos de código passivos para agentes inteligentes e interativos, promovendo maior acessibilidade e colaboração dentro do ecossistema de código aberto.
English
The widespread availability of open-source repositories has led to a vast collection of reusable software components, yet their utilization remains manual, error-prone, and disconnected. Developers must navigate documentation, understand APIs, and write integration code, creating significant barriers to efficient software reuse. To address this, we present EnvX, a framework that leverages Agentic AI to agentize GitHub repositories, transforming them into intelligent, autonomous agents capable of natural language interaction and inter-agent collaboration. Unlike existing approaches that treat repositories as static code resources, EnvX reimagines them as active agents through a three-phase process: (1) TODO-guided environment initialization, which sets up the necessary dependencies, data, and validation datasets; (2) human-aligned agentic automation, allowing repository-specific agents to autonomously perform real-world tasks; and (3) Agent-to-Agent (A2A) protocol, enabling multiple agents to collaborate. By combining large language model capabilities with structured tool integration, EnvX automates not just code generation, but the entire process of understanding, initializing, and operationalizing repository functionality. We evaluate EnvX on the GitTaskBench benchmark, using 18 repositories across domains such as image processing, speech recognition, document analysis, and video manipulation. Our results show that EnvX achieves a 74.07% execution completion rate and 51.85% task pass rate, outperforming existing frameworks. Case studies further demonstrate EnvX's ability to enable multi-repository collaboration via the A2A protocol. This work marks a shift from treating repositories as passive code resources to intelligent, interactive agents, fostering greater accessibility and collaboration within the open-source ecosystem.
PDF22September 11, 2025