OpenDevin: 범용 에이전트로서 AI 소프트웨어 개발자를 위한 오픈 플랫폼OpenDevin: An Open Platform for AI Software Developers as Generalist
Agents
소프트웨어는 우리 인간이 활용할 수 있는 가장 강력한 도구 중 하나로, 숙련된 프로그래머가 복잡하고 심오한 방식으로 세상과 상호작용할 수 있게 해줍니다. 동시에, 대규모 언어 모델(LLM)의 발전 덕분에 주변 환경과 상호작용하며 변화를 일으키는 AI 에이전트의 급속한 발전도 이루어지고 있습니다. 본 논문에서는 인간 개발자와 유사한 방식으로 세상과 상호작용하는 강력하고 유연한 AI 에이전트를 개발하기 위한 플랫폼인 OpenDevin을 소개합니다. 이 플랫폼은 코드 작성, 명령줄 상호작용, 웹 브라우징 등을 통해 새로운 에이전트를 구현하고, 코드 실행을 위한 샌드박스 환경과의 안전한 상호작용, 다중 에이전트 간의 조정, 평가 벤치마크의 통합을 가능하게 합니다. 현재 통합된 벤치마크를 기반으로, 소프트웨어 엔지니어링(예: SWE-Bench) 및 웹 브라우징(예: WebArena)을 포함한 15가지 도전적인 과제에 대해 에이전트를 평가합니다. 허가적인 MIT 라이선스로 공개된 OpenDevin은 학계와 산업계를 아우르는 커뮤니티 프로젝트로, 160명 이상의 기여자로부터 1,300건 이상의 기여를 받았으며, 앞으로 더욱 개선될 예정입니다.