AIDev: Onderzoek naar AI-codeeragents op GitHub
AIDev: Studying AI Coding Agents on GitHub
February 9, 2026
Auteurs: Hao Li, Haoxiang Zhang, Ahmed E. Hassan
cs.AI
Samenvatting
AI-coderingsagenten transformeren software-engineering in rap tempo door taken uit te voeren zoals functieontwikkeling, debuggen en testen. Ondanks hun groeiende impact ontbreekt het de onderzoeksgemeenschap aan een uitgebreide dataset die vastlegt hoe deze agenten worden gebruikt in real-world projecten. Om deze leemte op te vullen, introduceren we AIDev, een grootschalige dataset gericht op agent-geschreven pull requests (Agentic-PRs) in real-world GitHub repositories. AIDev verzamelt 932.791 Agentic-PRs geproduceerd door vijf agenten: OpenAI Codex, Devin, GitHub Copilot, Cursor en Claude Code. Deze PR's beslaan 116.211 repositories en betrokken 72.189 ontwikkelaars. Daarnaast bevat AIDev een gecureerde subset van 33.596 Agentic-PRs uit 2.807 repositories met meer dan 100 sterren, met aanvullende informatie zoals commentaren, reviews, commits en gerelateerde issues. Deze dataset biedt een basis voor toekomstig onderzoek naar AI-adoptie, ontwikkelaarsproductiviteit en mens-AI-samenwerking in het nieuwe tijdperk van software-engineering.
> AI-agent, Agentische AI, Coderingsagent, Agentisch programmeren, Agentische software-engineering, Agentisch ontwerpen
English
AI coding agents are rapidly transforming software engineering by performing tasks such as feature development, debugging, and testing. Despite their growing impact, the research community lacks a comprehensive dataset capturing how these agents are used in real-world projects. To address this gap, we introduce AIDev, a large-scale dataset focused on agent-authored pull requests (Agentic-PRs) in real-world GitHub repositories. AIDev aggregates 932,791 Agentic-PRs produced by five agents: OpenAI Codex, Devin, GitHub Copilot, Cursor, and Claude Code. These PRs span 116,211 repositories and involve 72,189 developers. In addition, AIDev includes a curated subset of 33,596 Agentic-PRs from 2,807 repositories with over 100 stars, providing further information such as comments, reviews, commits, and related issues. This dataset offers a foundation for future research on AI adoption, developer productivity, and human-AI collaboration in the new era of software engineering.
> AI Agent, Agentic AI, Coding Agent, Agentic Coding, Agentic Software Engineering, Agentic Engineering