OpenDevin:一个面向AI软件开发者的开放平台,作为通用智能体。OpenDevin: An Open Platform for AI Software Developers as Generalist
Agents
软件是我们人类手中最强大的工具之一;它使熟练的程序员能够以复杂和深远的方式与世界互动。与此同时,由于大型语言模型(LLMs)的改进,人工智能代理也迅速发展,这些代理与周围环境互动并产生影响。在本文中,我们介绍了OpenDevin,这是一个用于开发强大而灵活的人工智能代理的平台,这些代理与人类开发者类似地与世界互动:编写代码、与命令行交互和浏览网页。我们描述了该平台如何实现新代理、与沙盒环境安全互动以进行代码执行、协调多个代理之间的交互,并整合评估基准。基于我们目前整合的基准,我们对超过15项具有挑战性的任务进行了代理评估,包括软件工程(例如SWE-Bench)和网络浏览(例如WebArena)等。OpenDevin采用宽松的MIT许可证发布,是一个跨学术界和工业界的社区项目,拥有来自160多位贡献者的超过1.3K次贡献,并将不断改进。