ChatPaper.aiChatPaper

AIDev: Studio sugli agenti di programmazione IA su GitHub

AIDev: Studying AI Coding Agents on GitHub

February 9, 2026
Autori: Hao Li, Haoxiang Zhang, Ahmed E. Hassan
cs.AI

Abstract

Gli agenti di codifica IA stanno rapidamente trasformando l'ingegneria del software svolgendo compiti come lo sviluppo di funzionalità, il debug e i test. Nonostante il loro impatto crescente, la comunità di ricerca manca di un dataset completo che catturi come questi agenti vengono utilizzati in progetti reali. Per colmare questa lacuna, presentiamo AIDev, un dataset su larga scala incentrato sulle pull request scritte da agenti (Agentic-PR) in repository GitHub reali. AIDev aggrega 932.791 Agentic-PR prodotte da cinque agenti: OpenAI Codex, Devin, GitHub Copilot, Cursor e Claude Code. Queste PR coprono 116.211 repository e coinvolgono 72.189 sviluppatori. Inoltre, AIDev include un sottoinsieme curato di 33.596 Agentic-PR provenienti da 2.807 repository con oltre 100 stelle, fornendo ulteriori informazioni come commenti, revisioni, commit e issue correlate. Questo dataset offre una base per future ricerche sull'adozione dell'IA, la produttività degli sviluppatori e la collaborazione uomo-IA nella nuova era dell'ingegneria del software. > Agente IA, IA Agente, Agente di Codifica, Codifica Agente, Ingegneria del Software Agente, Ingegneria Agente
English
AI coding agents are rapidly transforming software engineering by performing tasks such as feature development, debugging, and testing. Despite their growing impact, the research community lacks a comprehensive dataset capturing how these agents are used in real-world projects. To address this gap, we introduce AIDev, a large-scale dataset focused on agent-authored pull requests (Agentic-PRs) in real-world GitHub repositories. AIDev aggregates 932,791 Agentic-PRs produced by five agents: OpenAI Codex, Devin, GitHub Copilot, Cursor, and Claude Code. These PRs span 116,211 repositories and involve 72,189 developers. In addition, AIDev includes a curated subset of 33,596 Agentic-PRs from 2,807 repositories with over 100 stars, providing further information such as comments, reviews, commits, and related issues. This dataset offers a foundation for future research on AI adoption, developer productivity, and human-AI collaboration in the new era of software engineering. > AI Agent, Agentic AI, Coding Agent, Agentic Coding, Agentic Software Engineering, Agentic Engineering
PDF33March 29, 2026