AIDev : Étude des agents de codage IA sur GitHub
AIDev: Studying AI Coding Agents on GitHub
February 9, 2026
papers.authors: Hao Li, Haoxiang Zhang, Ahmed E. Hassan
cs.AI
papers.abstract
Les agents d'IA de codage transforment rapidement l'ingénierie logicielle en réalisant des tâches telles que le développement de fonctionnalités, le débogage et les tests. Malgré leur impact croissant, la communauté de recherche manque d'un ensemble de données complet capturant l'utilisation de ces agents dans des projets réels. Pour combler cette lacune, nous présentons AIDev, un jeu de données à grande échelle centré sur les demandes de tirage (pull requests) rédigées par des agents (Agentic-PRs) dans des dépôts GitHub réels. AIDev agrège 932 791 Agentic-PRs produites par cinq agents : OpenAI Codex, Devin, GitHub Copilot, Cursor et Claude Code. Ces PR couvrent 116 211 dépôts et impliquent 72 189 développeurs. De plus, AIDev inclut un sous-ensemble sélectionné de 33 596 Agentic-PRs provenant de 2 807 dépôts ayant plus de 100 étoiles, fournissant des informations supplémentaires telles que les commentaires, les revues, les commits et les problèmes associés. Ce jeu de données offre une base pour les recherches futures sur l'adoption de l'IA, la productivité des développeurs et la collaboration humain-IA dans la nouvelle ère de l'ingénierie logicielle.
English
AI coding agents are rapidly transforming software engineering by performing tasks such as feature development, debugging, and testing. Despite their growing impact, the research community lacks a comprehensive dataset capturing how these agents are used in real-world projects. To address this gap, we introduce AIDev, a large-scale dataset focused on agent-authored pull requests (Agentic-PRs) in real-world GitHub repositories. AIDev aggregates 932,791 Agentic-PRs produced by five agents: OpenAI Codex, Devin, GitHub Copilot, Cursor, and Claude Code. These PRs span 116,211 repositories and involve 72,189 developers. In addition, AIDev includes a curated subset of 33,596 Agentic-PRs from 2,807 repositories with over 100 stars, providing further information such as comments, reviews, commits, and related issues. This dataset offers a foundation for future research on AI adoption, developer productivity, and human-AI collaboration in the new era of software engineering.
> AI Agent, Agentic AI, Coding Agent, Agentic Coding, Agentic Software Engineering, Agentic Engineering