ChatPaper.aiChatPaper

AIDev: GitHub上のAIコーディングエージェントに関する研究

AIDev: Studying AI Coding Agents on GitHub

February 9, 2026
著者: Hao Li, Haoxiang Zhang, Ahmed E. Hassan
cs.AI

要旨

AIコーディングエージェントは、機能開発、デバッグ、テストなどのタスクを実行することで、ソフトウェアエンジニアリングを急速に変革しつつある。その影響力が増大しているにもかかわらず、研究コミュニティには、実際のプロジェクトでこれらのエージェントがどのように使用されているかを捉えた包括的なデータセットが不足している。このギャップを埋めるため、我々は実際のGitHubリポジトリにおけるエージェント作成のプルリクエスト(Agentic-PR)に焦点を当てた大規模データセットAIDevを紹介する。AIDevは、OpenAI Codex、Devin、GitHub Copilot、Cursor、Claude Codeという5つのエージェントによって生成された932,791件のAgentic-PRを集約している。これらのPRは116,211のリポジトリにまたがり、72,189人の開発者が関与している。さらに、AIDevには、スター数が100を超える2,807のリポジトリから精選された33,596件のAgentic-PRのサブセットが含まれており、コメント、レビュー、コミット、関連するIssueといった追加情報を提供する。このデータセットは、AIの採用、開発者の生産性、ソフトウェアエンジニアリングの新時代における人間とAIの協働に関する将来の研究の基盤を提供する。 > AIエージェント、エージェンティックAI、コーディングエージェント、エージェンティックコーディング、エージェンティックソフトウェアエンジニアリング、エージェンティックエンジニアリング
English
AI coding agents are rapidly transforming software engineering by performing tasks such as feature development, debugging, and testing. Despite their growing impact, the research community lacks a comprehensive dataset capturing how these agents are used in real-world projects. To address this gap, we introduce AIDev, a large-scale dataset focused on agent-authored pull requests (Agentic-PRs) in real-world GitHub repositories. AIDev aggregates 932,791 Agentic-PRs produced by five agents: OpenAI Codex, Devin, GitHub Copilot, Cursor, and Claude Code. These PRs span 116,211 repositories and involve 72,189 developers. In addition, AIDev includes a curated subset of 33,596 Agentic-PRs from 2,807 repositories with over 100 stars, providing further information such as comments, reviews, commits, and related issues. This dataset offers a foundation for future research on AI adoption, developer productivity, and human-AI collaboration in the new era of software engineering. > AI Agent, Agentic AI, Coding Agent, Agentic Coding, Agentic Software Engineering, Agentic Engineering
PDF23February 18, 2026