OpenDevin: Eine offene Plattform für KI-Softwareentwickler als Generalisten-Agenten
OpenDevin: An Open Platform for AI Software Developers as Generalist Agents
July 23, 2024
Autoren: Xingyao Wang, Boxuan Li, Yufan Song, Frank F. Xu, Xiangru Tang, Mingchen Zhuge, Jiayi Pan, Yueqi Song, Bowen Li, Jaskirat Singh, Hoang H. Tran, Fuqiang Li, Ren Ma, Mingzhang Zheng, Bill Qian, Yanjun Shao, Niklas Muennighoff, Yizhe Zhang, Binyuan Hui, Junyang Lin, Robert Brennan, Hao Peng, Heng Ji, Graham Neubig
cs.AI
Zusammenfassung
Software ist eines der leistungsstärksten Werkzeuge, die uns Menschen zur Verfügung stehen; es ermöglicht einem erfahrenen Programmierer, auf komplexe und tiefgreifende Weise mit der Welt zu interagieren. Gleichzeitig hat es dank Verbesserungen in großen Sprachmodellen (LLMs) auch eine rasante Entwicklung von KI-Agenten gegeben, die mit ihrer Umgebung interagieren und Veränderungen bewirken. In diesem Artikel stellen wir OpenDevin vor, eine Plattform zur Entwicklung leistungsstarker und flexibler KI-Agenten, die auf ähnliche Weise wie ein menschlicher Entwickler mit der Welt interagieren: durch das Schreiben von Code, die Interaktion mit einer Befehlszeile und das Durchsuchen des Webs. Wir beschreiben, wie die Plattform die Implementierung neuer Agenten, die sichere Interaktion mit abgeschotteten Umgebungen für die Codeausführung, die Koordination zwischen mehreren Agenten und die Integration von Evaluierungsbenchmarks ermöglicht. Basierend auf unseren derzeit integrierten Benchmarks führen wir eine Bewertung der Agenten über 15 anspruchsvolle Aufgaben durch, darunter Softwaretechnik (z. B. SWE-Bench) und Web-Browsing (z. B. WebArena), unter anderem. Unter der freizügigen MIT-Lizenz veröffentlicht, ist OpenDevin ein Gemeinschaftsprojekt, das die Bereiche Wissenschaft und Industrie umspannt und mehr als 1,3K Beiträge von über 160 Beitragenden aufweist und sich kontinuierlich verbessern wird.
English
Software is one of the most powerful tools that we humans have at our
disposal; it allows a skilled programmer to interact with the world in complex
and profound ways. At the same time, thanks to improvements in large language
models (LLMs), there has also been a rapid development in AI agents that
interact with and affect change in their surrounding environments. In this
paper, we introduce OpenDevin, a platform for the development of powerful and
flexible AI agents that interact with the world in similar ways to those of a
human developer: by writing code, interacting with a command line, and browsing
the web. We describe how the platform allows for the implementation of new
agents, safe interaction with sandboxed environments for code execution,
coordination between multiple agents, and incorporation of evaluation
benchmarks. Based on our currently incorporated benchmarks, we perform an
evaluation of agents over 15 challenging tasks, including software engineering
(e.g., SWE-Bench) and web browsing (e.g., WebArena), among others. Released
under the permissive MIT license, OpenDevin is a community project spanning
academia and industry with more than 1.3K contributions from over 160
contributors and will improve going forward.Summary
AI-Generated Summary