AIDev: Untersuchung von KI-Codierungsagenten auf GitHub
AIDev: Studying AI Coding Agents on GitHub
February 9, 2026
papers.authors: Hao Li, Haoxiang Zhang, Ahmed E. Hassan
cs.AI
papers.abstract
KI-Code-Agenten verändern die Softwareentwicklung grundlegend, indem sie Aufgaben wie Feature-Entwicklung, Debugging und Tests übernehmen. Trotz ihrer wachsenden Bedeutung fehlt der Forschungsgemeinschaft ein umfassender Datensatz, der die Nutzung dieser Agenten in realen Projekten erfasst. Um diese Lücke zu schließen, stellen wir AIDev vor – einen groß angelegten Datensatz, der sich auf von Agenten verfasste Pull Requests (Agentic-PRs) in GitHub-Repositories konzentriert. AIDev umfasst 932.791 Agentic-PRs von fünf Agenten: OpenAI Codex, Devin, GitHub Copilot, Cursor und Claude Code. Diese PRs erstrecken sich über 116.211 Repositories und involvieren 72.189 Entwickler. Zusätzlich enthält AIDev einen kuratierten Teilbestand von 33.596 Agentic-PRs aus 2.807 Repositories mit mehr als 100 Sternen, ergänzt um Informationen wie Kommentare, Reviews, Commits und zugehörige Issues. Dieser Datensatz bildet eine Grundlage für künftige Forschung zu KI-Adoption, Entwicklerproduktivität und Mensch-KI-Kollaboration im neuen Zeitalter der Softwareentwicklung.
> KI-Agent, Agentische KI, Code-Agent, Agentische Code-Erstellung, Agentische Softwareentwicklung, Agentische Entwicklung
English
AI coding agents are rapidly transforming software engineering by performing tasks such as feature development, debugging, and testing. Despite their growing impact, the research community lacks a comprehensive dataset capturing how these agents are used in real-world projects. To address this gap, we introduce AIDev, a large-scale dataset focused on agent-authored pull requests (Agentic-PRs) in real-world GitHub repositories. AIDev aggregates 932,791 Agentic-PRs produced by five agents: OpenAI Codex, Devin, GitHub Copilot, Cursor, and Claude Code. These PRs span 116,211 repositories and involve 72,189 developers. In addition, AIDev includes a curated subset of 33,596 Agentic-PRs from 2,807 repositories with over 100 stars, providing further information such as comments, reviews, commits, and related issues. This dataset offers a foundation for future research on AI adoption, developer productivity, and human-AI collaboration in the new era of software engineering.
> AI Agent, Agentic AI, Coding Agent, Agentic Coding, Agentic Software Engineering, Agentic Engineering