ChatPaper.aiChatPaper

OpenDevin : Une plateforme ouverte pour les développeurs de logiciels d'IA en tant qu'agents généralistes

OpenDevin: An Open Platform for AI Software Developers as Generalist Agents

July 23, 2024
Auteurs: Xingyao Wang, Boxuan Li, Yufan Song, Frank F. Xu, Xiangru Tang, Mingchen Zhuge, Jiayi Pan, Yueqi Song, Bowen Li, Jaskirat Singh, Hoang H. Tran, Fuqiang Li, Ren Ma, Mingzhang Zheng, Bill Qian, Yanjun Shao, Niklas Muennighoff, Yizhe Zhang, Binyuan Hui, Junyang Lin, Robert Brennan, Hao Peng, Heng Ji, Graham Neubig
cs.AI

Résumé

Le logiciel est l'un des outils les plus puissants dont nous, humains, disposons ; il permet à un programmeur compétent d'interagir avec le monde de manière complexe et profonde. Parallèlement, grâce aux améliorations apportées aux grands modèles de langage (LLMs), il y a eu un développement rapide des agents d'IA qui interagissent avec leur environnement et y provoquent des changements. Dans cet article, nous présentons OpenDevin, une plateforme pour le développement d'agents d'IA puissants et flexibles qui interagissent avec le monde de manière similaire à celle d'un développeur humain : en écrivant du code, en interagissant avec une ligne de commande et en naviguant sur le web. Nous décrivons comment la plateforme permet la mise en œuvre de nouveaux agents, une interaction sécurisée avec des environnements sandbox pour l'exécution de code, la coordination entre plusieurs agents et l'intégration de benchmarks d'évaluation. Sur la base des benchmarks actuellement intégrés, nous effectuons une évaluation des agents sur 15 tâches complexes, incluant l'ingénierie logicielle (par exemple, SWE-Bench) et la navigation web (par exemple, WebArena), entre autres. Publié sous la licence permissive MIT, OpenDevin est un projet communautaire rassemblant le monde académique et l'industrie, avec plus de 1,3K contributions de plus de 160 contributeurs, et continuera à s'améliorer à l'avenir.
English
Software is one of the most powerful tools that we humans have at our disposal; it allows a skilled programmer to interact with the world in complex and profound ways. At the same time, thanks to improvements in large language models (LLMs), there has also been a rapid development in AI agents that interact with and affect change in their surrounding environments. In this paper, we introduce OpenDevin, a platform for the development of powerful and flexible AI agents that interact with the world in similar ways to those of a human developer: by writing code, interacting with a command line, and browsing the web. We describe how the platform allows for the implementation of new agents, safe interaction with sandboxed environments for code execution, coordination between multiple agents, and incorporation of evaluation benchmarks. Based on our currently incorporated benchmarks, we perform an evaluation of agents over 15 challenging tasks, including software engineering (e.g., SWE-Bench) and web browsing (e.g., WebArena), among others. Released under the permissive MIT license, OpenDevin is a community project spanning academia and industry with more than 1.3K contributions from over 160 contributors and will improve going forward.

Summary

AI-Generated Summary

PDF725November 28, 2024