EnvX: Агентизируйте всё с помощью агентного ИИ
EnvX: Agentize Everything with Agentic AI
September 9, 2025
Авторы: Linyao Chen, Zimian Peng, Yingxuan Yang, Yikun Wang, Wenzheng Tom Tang, Hiroki H. Kobayashi, Weinan Zhang
cs.AI
Аннотация
Широкое распространение открытых репозиториев привело к созданию обширной коллекции повторно используемых программных компонентов, однако их использование остается ручным, подверженным ошибкам и разрозненным. Разработчикам приходится изучать документацию, понимать API и писать код для интеграции, что создает значительные препятствия для эффективного повторного использования программного обеспечения. Для решения этой проблемы мы представляем EnvX — фреймворк, который использует агентный искусственный интеллект для преобразования репозиториев GitHub в интеллектуальных автономных агентов, способных взаимодействовать на естественном языке и сотрудничать между собой. В отличие от существующих подходов, которые рассматривают репозитории как статические ресурсы кода, EnvX переосмысливает их как активных агентов через трехэтапный процесс: (1) инициализация среды на основе TODO, которая настраивает необходимые зависимости, данные и тестовые наборы; (2) автоматизация, ориентированная на человека, позволяющая агентам, специфичным для репозитория, автономно выполнять реальные задачи; и (3) протокол Agent-to-Agent (A2A), обеспечивающий совместную работу нескольких агентов. Объединяя возможности больших языковых моделей с интеграцией структурированных инструментов, EnvX автоматизирует не только генерацию кода, но и весь процесс понимания, инициализации и операционализации функциональности репозитория. Мы оцениваем EnvX на бенчмарке GitTaskBench, используя 18 репозиториев в таких областях, как обработка изображений, распознавание речи, анализ документов и обработка видео. Наши результаты показывают, что EnvX достигает 74,07% успешного выполнения задач и 51,85% успешного прохождения тестов, превосходя существующие фреймворки. Кейс-стади также демонстрируют способность EnvX обеспечивать совместную работу нескольких репозиториев через протокол A2A. Эта работа знаменует переход от восприятия репозиториев как пассивных ресурсов кода к интеллектуальным интерактивным агентам, способствуя большей доступности и сотрудничеству в экосистеме открытого исходного кода.
English
The widespread availability of open-source repositories has led to a vast
collection of reusable software components, yet their utilization remains
manual, error-prone, and disconnected. Developers must navigate documentation,
understand APIs, and write integration code, creating significant barriers to
efficient software reuse. To address this, we present EnvX, a framework that
leverages Agentic AI to agentize GitHub repositories, transforming them into
intelligent, autonomous agents capable of natural language interaction and
inter-agent collaboration. Unlike existing approaches that treat repositories
as static code resources, EnvX reimagines them as active agents through a
three-phase process: (1) TODO-guided environment initialization, which sets up
the necessary dependencies, data, and validation datasets; (2) human-aligned
agentic automation, allowing repository-specific agents to autonomously perform
real-world tasks; and (3) Agent-to-Agent (A2A) protocol, enabling multiple
agents to collaborate. By combining large language model capabilities with
structured tool integration, EnvX automates not just code generation, but the
entire process of understanding, initializing, and operationalizing repository
functionality. We evaluate EnvX on the GitTaskBench benchmark, using 18
repositories across domains such as image processing, speech recognition,
document analysis, and video manipulation. Our results show that EnvX achieves
a 74.07% execution completion rate and 51.85% task pass rate, outperforming
existing frameworks. Case studies further demonstrate EnvX's ability to enable
multi-repository collaboration via the A2A protocol. This work marks a shift
from treating repositories as passive code resources to intelligent,
interactive agents, fostering greater accessibility and collaboration within
the open-source ecosystem.