ChatPaper.aiChatPaper

AIDev: GitHub에서 AI 코딩 에이전트 연구하기

AIDev: Studying AI Coding Agents on GitHub

February 9, 2026
저자: Hao Li, Haoxiang Zhang, Ahmed E. Hassan
cs.AI

초록

AI 코딩 에이전트는 기능 개발, 디버깅, 테스팅과 같은 작업을 수행함으로써 소프트웨어 공학을 빠르게 변화시키고 있습니다. 이러한 영향력이 커지고 있음에도 불구하고, 연구 커뮤니티는 실제 프로젝트에서 이러한 에이전트가 어떻게 사용되는지를 포착하는 포괄적인 데이터셋을 갖추지 못하고 있습니다. 이러한 격차를 해소하기 위해 우리는 실제 GitHub 저장소에서 에이전트가 작성한 풀 리퀘스트(Agentic-PR)에 초점을 맞춘 대규모 데이터셋인 AIDev를 소개합니다. AIDev는 OpenAI Codex, Devin, GitHub Copilot, Cursor, Claude Code라는 5가지 에이전트가 생성한 932,791개의 Agentic-PR을 집계합니다. 이러한 PR들은 116,211개의 저장소에 걸쳐 있으며 72,189명의 개발자가 관여했습니다. 또한 AIDev는 별표 100개 이상을 받은 2,807개 저장소의 33,596개 Agentic-PR로 구성된 정제된 하위 집합을 포함하며, 여기에는 코멘트, 리뷰, 커밋, 관련 이슈 등의 추가 정보가 제공됩니다. 이 데이터셋은 새로운 시대의 소프트웨어 공학에서 AI 도입, 개발자 생산성, 인간-AI 협업에 대한 향후 연구의 기초를 마련합니다. > AI 에이전트, 에이전트형 AI, 코딩 에이전트, 에이전트형 코딩, 에이전트형 소프트웨어 공학, 에이전트형 엔지니어링
English
AI coding agents are rapidly transforming software engineering by performing tasks such as feature development, debugging, and testing. Despite their growing impact, the research community lacks a comprehensive dataset capturing how these agents are used in real-world projects. To address this gap, we introduce AIDev, a large-scale dataset focused on agent-authored pull requests (Agentic-PRs) in real-world GitHub repositories. AIDev aggregates 932,791 Agentic-PRs produced by five agents: OpenAI Codex, Devin, GitHub Copilot, Cursor, and Claude Code. These PRs span 116,211 repositories and involve 72,189 developers. In addition, AIDev includes a curated subset of 33,596 Agentic-PRs from 2,807 repositories with over 100 stars, providing further information such as comments, reviews, commits, and related issues. This dataset offers a foundation for future research on AI adoption, developer productivity, and human-AI collaboration in the new era of software engineering. > AI Agent, Agentic AI, Coding Agent, Agentic Coding, Agentic Software Engineering, Agentic Engineering
PDF23February 18, 2026