OpenDevin: 汎用エージェントとしてのAIソフトウェア開発者向けオープンプラットフォームOpenDevin: An Open Platform for AI Software Developers as Generalist
Agents
ソフトウェアは、私たち人間が利用できる最も強力なツールの一つです。熟練したプログラマーが複雑で深遠な方法で世界と関わることを可能にします。同時に、大規模言語モデル(LLMs)の進歩により、周囲の環境と相互作用し、変化をもたらすAIエージェントの急速な発展も見られています。本論文では、OpenDevinというプラットフォームを紹介します。これは、人間の開発者と同様の方法で世界と関わる強力で柔軟なAIエージェントを開発するためのプラットフォームです。具体的には、コードを書く、コマンドラインとやり取りする、ウェブを閲覧するといった方法で世界と関わります。本プラットフォームが、新しいエージェントの実装、コード実行のためのサンドボックス環境との安全な相互作用、複数のエージェント間の調整、評価ベンチマークの組み込みをどのように可能にするかを説明します。現在組み込まれているベンチマークに基づき、ソフトウェアエンジニアリング(例:SWE-Bench)やウェブ閲覧(例:WebArena)など、15の挑戦的なタスクに対するエージェントの評価を行います。OpenDevinは、寛容なMITライセンスの下でリリースされており、学界と産業界にまたがるコミュニティプロジェクトで、160人以上の貢献者から1,300以上の貢献があり、今後も改善されていく予定です。