OpenDevin: 범용 에이전트로서 AI 소프트웨어 개발자를 위한 오픈 플랫폼
OpenDevin: An Open Platform for AI Software Developers as Generalist Agents
July 23, 2024
저자: Xingyao Wang, Boxuan Li, Yufan Song, Frank F. Xu, Xiangru Tang, Mingchen Zhuge, Jiayi Pan, Yueqi Song, Bowen Li, Jaskirat Singh, Hoang H. Tran, Fuqiang Li, Ren Ma, Mingzhang Zheng, Bill Qian, Yanjun Shao, Niklas Muennighoff, Yizhe Zhang, Binyuan Hui, Junyang Lin, Robert Brennan, Hao Peng, Heng Ji, Graham Neubig
cs.AI
초록
소프트웨어는 우리 인간이 활용할 수 있는 가장 강력한 도구 중 하나로, 숙련된 프로그래머가 복잡하고 심오한 방식으로 세상과 상호작용할 수 있게 해줍니다. 동시에, 대규모 언어 모델(LLM)의 발전 덕분에 주변 환경과 상호작용하며 변화를 일으키는 AI 에이전트의 급속한 발전도 이루어지고 있습니다. 본 논문에서는 인간 개발자와 유사한 방식으로 세상과 상호작용하는 강력하고 유연한 AI 에이전트를 개발하기 위한 플랫폼인 OpenDevin을 소개합니다. 이 플랫폼은 코드 작성, 명령줄 상호작용, 웹 브라우징 등을 통해 새로운 에이전트를 구현하고, 코드 실행을 위한 샌드박스 환경과의 안전한 상호작용, 다중 에이전트 간의 조정, 평가 벤치마크의 통합을 가능하게 합니다. 현재 통합된 벤치마크를 기반으로, 소프트웨어 엔지니어링(예: SWE-Bench) 및 웹 브라우징(예: WebArena)을 포함한 15가지 도전적인 과제에 대해 에이전트를 평가합니다. 허가적인 MIT 라이선스로 공개된 OpenDevin은 학계와 산업계를 아우르는 커뮤니티 프로젝트로, 160명 이상의 기여자로부터 1,300건 이상의 기여를 받았으며, 앞으로 더욱 개선될 예정입니다.
English
Software is one of the most powerful tools that we humans have at our
disposal; it allows a skilled programmer to interact with the world in complex
and profound ways. At the same time, thanks to improvements in large language
models (LLMs), there has also been a rapid development in AI agents that
interact with and affect change in their surrounding environments. In this
paper, we introduce OpenDevin, a platform for the development of powerful and
flexible AI agents that interact with the world in similar ways to those of a
human developer: by writing code, interacting with a command line, and browsing
the web. We describe how the platform allows for the implementation of new
agents, safe interaction with sandboxed environments for code execution,
coordination between multiple agents, and incorporation of evaluation
benchmarks. Based on our currently incorporated benchmarks, we perform an
evaluation of agents over 15 challenging tasks, including software engineering
(e.g., SWE-Bench) and web browsing (e.g., WebArena), among others. Released
under the permissive MIT license, OpenDevin is a community project spanning
academia and industry with more than 1.3K contributions from over 160
contributors and will improve going forward.