ChatPaper.aiChatPaper

OpenDevin: Una Plataforma Abierta para Desarrolladores de Software de IA como Agentes Generalistas

OpenDevin: An Open Platform for AI Software Developers as Generalist Agents

July 23, 2024
Autores: Xingyao Wang, Boxuan Li, Yufan Song, Frank F. Xu, Xiangru Tang, Mingchen Zhuge, Jiayi Pan, Yueqi Song, Bowen Li, Jaskirat Singh, Hoang H. Tran, Fuqiang Li, Ren Ma, Mingzhang Zheng, Bill Qian, Yanjun Shao, Niklas Muennighoff, Yizhe Zhang, Binyuan Hui, Junyang Lin, Robert Brennan, Hao Peng, Heng Ji, Graham Neubig
cs.AI

Resumen

El software es una de las herramientas más poderosas que tenemos los humanos a nuestra disposición; permite a un programador hábil interactuar con el mundo de formas complejas y profundas. Al mismo tiempo, gracias a los avances en modelos de lenguaje grandes (LLMs, por sus siglas en inglés), también ha habido un rápido desarrollo en agentes de IA que interactúan y provocan cambios en sus entornos circundantes. En este artículo, presentamos OpenDevin, una plataforma para el desarrollo de agentes de IA potentes y flexibles que interactúan con el mundo de manera similar a la de un desarrollador humano: escribiendo código, interactuando con una línea de comandos y navegando por la web. Describimos cómo la plataforma permite la implementación de nuevos agentes, la interacción segura con entornos aislados para la ejecución de código, la coordinación entre múltiples agentes y la incorporación de benchmarks de evaluación. Basándonos en los benchmarks actualmente incorporados, realizamos una evaluación de agentes en 15 tareas desafiantes, que incluyen ingeniería de software (por ejemplo, SWE-Bench) y navegación web (por ejemplo, WebArena), entre otros. Publicado bajo la licencia MIT permisiva, OpenDevin es un proyecto comunitario que abarca la academia y la industria, con más de 1.3K contribuciones de más de 160 colaboradores y seguirá mejorando en el futuro.
English
Software is one of the most powerful tools that we humans have at our disposal; it allows a skilled programmer to interact with the world in complex and profound ways. At the same time, thanks to improvements in large language models (LLMs), there has also been a rapid development in AI agents that interact with and affect change in their surrounding environments. In this paper, we introduce OpenDevin, a platform for the development of powerful and flexible AI agents that interact with the world in similar ways to those of a human developer: by writing code, interacting with a command line, and browsing the web. We describe how the platform allows for the implementation of new agents, safe interaction with sandboxed environments for code execution, coordination between multiple agents, and incorporation of evaluation benchmarks. Based on our currently incorporated benchmarks, we perform an evaluation of agents over 15 challenging tasks, including software engineering (e.g., SWE-Bench) and web browsing (e.g., WebArena), among others. Released under the permissive MIT license, OpenDevin is a community project spanning academia and industry with more than 1.3K contributions from over 160 contributors and will improve going forward.

Summary

AI-Generated Summary

PDF725November 28, 2024