EnvX: 에이전트 AI로 모든 것을 에이전트화하다
EnvX: Agentize Everything with Agentic AI
September 9, 2025
저자: Linyao Chen, Zimian Peng, Yingxuan Yang, Yikun Wang, Wenzheng Tom Tang, Hiroki H. Kobayashi, Weinan Zhang
cs.AI
초록
오픈소스 저장소의 광범위한 보급으로 인해 재사용 가능한 소프트웨어 컴포넌트의 방대한 컬렉션이 형성되었지만, 이들의 활용은 여전히 수동적이고 오류가 발생하기 쉬우며 단절된 상태입니다. 개발자들은 문서를 탐색하고 API를 이해하며 통합 코드를 작성해야 하므로, 효율적인 소프트웨어 재사용에 상당한 장벽이 존재합니다. 이를 해결하기 위해, 우리는 에이전트형 AI를 활용하여 GitHub 저장소를 에이전트화하는 EnvX 프레임워크를 제안합니다. 이 프레임워크는 저장소를 자연어 상호작용 및 에이전트 간 협업이 가능한 지능형 자율 에이전트로 변환합니다. 기존의 접근 방식이 저장소를 정적 코드 자원으로 취급하는 것과 달리, EnvX는 저장소를 활성 에이전트로 재구상하는 세 단계 프로세스를 통해 이를 실현합니다: (1) TODO 가이드 환경 초기화, 이는 필요한 종속성, 데이터 및 검증 데이터셋을 설정합니다; (2) 인간과 조율된 에이전트형 자동화, 이는 저장소 특화 에이전트가 실제 작업을 자율적으로 수행할 수 있게 합니다; 그리고 (3) 에이전트 간(A2A) 프로토콜, 이는 여러 에이전트가 협업할 수 있도록 합니다. 대규모 언어 모델의 능력과 구조화된 도구 통합을 결합함으로써, EnvX는 코드 생성뿐만 아니라 저장소 기능을 이해하고 초기화하며 운영화하는 전체 프로세스를 자동화합니다. 우리는 이미지 처리, 음성 인식, 문서 분석 및 비디오 조작과 같은 다양한 도메인에 걸친 18개의 저장소를 사용하여 GitTaskBench 벤치마크에서 EnvX를 평가했습니다. 그 결과, EnvX는 74.07%의 실행 완료율과 51.85%의 작업 통과율을 달성하여 기존 프레임워크를 능가하는 성능을 보였습니다. 사례 연구는 A2A 프로토콜을 통한 다중 저장소 협업을 가능하게 하는 EnvX의 능력을 추가로 입증합니다. 이 작업은 저장소를 수동적 코드 자원에서 지능적이고 상호작용 가능한 에이전트로 전환함으로써, 오픈소스 생태계 내에서 더 큰 접근성과 협업을 촉진하는 전환점을 마련합니다.
English
The widespread availability of open-source repositories has led to a vast
collection of reusable software components, yet their utilization remains
manual, error-prone, and disconnected. Developers must navigate documentation,
understand APIs, and write integration code, creating significant barriers to
efficient software reuse. To address this, we present EnvX, a framework that
leverages Agentic AI to agentize GitHub repositories, transforming them into
intelligent, autonomous agents capable of natural language interaction and
inter-agent collaboration. Unlike existing approaches that treat repositories
as static code resources, EnvX reimagines them as active agents through a
three-phase process: (1) TODO-guided environment initialization, which sets up
the necessary dependencies, data, and validation datasets; (2) human-aligned
agentic automation, allowing repository-specific agents to autonomously perform
real-world tasks; and (3) Agent-to-Agent (A2A) protocol, enabling multiple
agents to collaborate. By combining large language model capabilities with
structured tool integration, EnvX automates not just code generation, but the
entire process of understanding, initializing, and operationalizing repository
functionality. We evaluate EnvX on the GitTaskBench benchmark, using 18
repositories across domains such as image processing, speech recognition,
document analysis, and video manipulation. Our results show that EnvX achieves
a 74.07% execution completion rate and 51.85% task pass rate, outperforming
existing frameworks. Case studies further demonstrate EnvX's ability to enable
multi-repository collaboration via the A2A protocol. This work marks a shift
from treating repositories as passive code resources to intelligent,
interactive agents, fostering greater accessibility and collaboration within
the open-source ecosystem.