OpenDevin: Uma Plataforma Aberta para Desenvolvedores de Software de IA como Agentes Generalistas
OpenDevin: An Open Platform for AI Software Developers as Generalist Agents
July 23, 2024
Autores: Xingyao Wang, Boxuan Li, Yufan Song, Frank F. Xu, Xiangru Tang, Mingchen Zhuge, Jiayi Pan, Yueqi Song, Bowen Li, Jaskirat Singh, Hoang H. Tran, Fuqiang Li, Ren Ma, Mingzhang Zheng, Bill Qian, Yanjun Shao, Niklas Muennighoff, Yizhe Zhang, Binyuan Hui, Junyang Lin, Robert Brennan, Hao Peng, Heng Ji, Graham Neubig
cs.AI
Resumo
O software é uma das ferramentas mais poderosas que nós, humanos, temos à nossa disposição; permite a um programador habilidoso interagir com o mundo de maneiras complexas e profundas. Ao mesmo tempo, graças às melhorias em modelos de linguagem grandes (LLMs), também houve um rápido desenvolvimento em agentes de IA que interagem e afetam mudanças em seus ambientes circundantes. Neste artigo, apresentamos o OpenDevin, uma plataforma para o desenvolvimento de agentes de IA poderosos e flexíveis que interagem com o mundo de maneiras semelhantes às de um desenvolvedor humano: escrevendo código, interagindo com uma linha de comando e navegando na web. Descrevemos como a plataforma permite a implementação de novos agentes, interação segura com ambientes isolados para execução de código, coordenação entre múltiplos agentes e incorporação de benchmarks de avaliação. Com base nos benchmarks atualmente incorporados, realizamos uma avaliação de agentes em 15 tarefas desafiadoras, incluindo engenharia de software (por exemplo, SWE-Bench) e navegação na web (por exemplo, WebArena), entre outros. Lançado sob a licença MIT permissiva, o OpenDevin é um projeto comunitário que abrange academia e indústria, com mais de 1,3 mil contribuições de mais de 160 colaboradores e continuará a melhorar no futuro.
English
Software is one of the most powerful tools that we humans have at our
disposal; it allows a skilled programmer to interact with the world in complex
and profound ways. At the same time, thanks to improvements in large language
models (LLMs), there has also been a rapid development in AI agents that
interact with and affect change in their surrounding environments. In this
paper, we introduce OpenDevin, a platform for the development of powerful and
flexible AI agents that interact with the world in similar ways to those of a
human developer: by writing code, interacting with a command line, and browsing
the web. We describe how the platform allows for the implementation of new
agents, safe interaction with sandboxed environments for code execution,
coordination between multiple agents, and incorporation of evaluation
benchmarks. Based on our currently incorporated benchmarks, we perform an
evaluation of agents over 15 challenging tasks, including software engineering
(e.g., SWE-Bench) and web browsing (e.g., WebArena), among others. Released
under the permissive MIT license, OpenDevin is a community project spanning
academia and industry with more than 1.3K contributions from over 160
contributors and will improve going forward.Summary
AI-Generated Summary