OpenDevin:一個針對AI軟體開發者的開放平台,作為通用代理人。OpenDevin: An Open Platform for AI Software Developers as Generalist
Agents
軟體是我們人類手中最強大的工具之一;它讓熟練的程式設計師能以複雜而深遠的方式與世界互動。與此同時,由於大型語言模型(LLMs)的改進,人工智慧代理也有了快速發展,這些代理可以與周圍環境互動並產生影響。在本文中,我們介紹了OpenDevin,這是一個用於開發功能強大且靈活的人工智慧代理的平台,這些代理與人類開發者類似地通過編寫程式碼、與命令列互動和瀏覽網頁來與世界互動。我們描述了這個平台如何實現新代理、與用於程式碼執行的沙箱環境進行安全互動、協調多個代理之間的互動以及整合評估基準。基於我們目前整合的基準,我們對超過15個具有挑戰性的任務進行了代理評估,包括軟體工程(例如SWE-Bench)和網頁瀏覽(例如WebArena)等。OpenDevin以寬鬆的MIT許可證發布,是一個跨越學術界和工業界的社區項目,有來自160多位貢獻者的超過1.3K次貢獻,並將不斷改進。