ChatPaper.aiChatPaper

OpenDevin: 汎用エージェントとしてのAIソフトウェア開発者向けオープンプラットフォーム

OpenDevin: An Open Platform for AI Software Developers as Generalist Agents

July 23, 2024
著者: Xingyao Wang, Boxuan Li, Yufan Song, Frank F. Xu, Xiangru Tang, Mingchen Zhuge, Jiayi Pan, Yueqi Song, Bowen Li, Jaskirat Singh, Hoang H. Tran, Fuqiang Li, Ren Ma, Mingzhang Zheng, Bill Qian, Yanjun Shao, Niklas Muennighoff, Yizhe Zhang, Binyuan Hui, Junyang Lin, Robert Brennan, Hao Peng, Heng Ji, Graham Neubig
cs.AI

要旨

ソフトウェアは、私たち人間が利用できる最も強力なツールの一つです。熟練したプログラマーが複雑で深遠な方法で世界と関わることを可能にします。同時に、大規模言語モデル(LLMs)の進歩により、周囲の環境と相互作用し、変化をもたらすAIエージェントの急速な発展も見られています。本論文では、OpenDevinというプラットフォームを紹介します。これは、人間の開発者と同様の方法で世界と関わる強力で柔軟なAIエージェントを開発するためのプラットフォームです。具体的には、コードを書く、コマンドラインとやり取りする、ウェブを閲覧するといった方法で世界と関わります。本プラットフォームが、新しいエージェントの実装、コード実行のためのサンドボックス環境との安全な相互作用、複数のエージェント間の調整、評価ベンチマークの組み込みをどのように可能にするかを説明します。現在組み込まれているベンチマークに基づき、ソフトウェアエンジニアリング(例:SWE-Bench)やウェブ閲覧(例:WebArena)など、15の挑戦的なタスクに対するエージェントの評価を行います。OpenDevinは、寛容なMITライセンスの下でリリースされており、学界と産業界にまたがるコミュニティプロジェクトで、160人以上の貢献者から1,300以上の貢献があり、今後も改善されていく予定です。
English
Software is one of the most powerful tools that we humans have at our disposal; it allows a skilled programmer to interact with the world in complex and profound ways. At the same time, thanks to improvements in large language models (LLMs), there has also been a rapid development in AI agents that interact with and affect change in their surrounding environments. In this paper, we introduce OpenDevin, a platform for the development of powerful and flexible AI agents that interact with the world in similar ways to those of a human developer: by writing code, interacting with a command line, and browsing the web. We describe how the platform allows for the implementation of new agents, safe interaction with sandboxed environments for code execution, coordination between multiple agents, and incorporation of evaluation benchmarks. Based on our currently incorporated benchmarks, we perform an evaluation of agents over 15 challenging tasks, including software engineering (e.g., SWE-Bench) and web browsing (e.g., WebArena), among others. Released under the permissive MIT license, OpenDevin is a community project spanning academia and industry with more than 1.3K contributions from over 160 contributors and will improve going forward.

Summary

AI-Generated Summary

PDF725November 28, 2024