ChatPaper.aiChatPaper

AIDev: Исследование агентов искусственного интеллекта для написания кода на GitHub

AIDev: Studying AI Coding Agents on GitHub

February 9, 2026
Авторы: Hao Li, Haoxiang Zhang, Ahmed E. Hassan
cs.AI

Аннотация

AI-агенты для программирования стремительно трансформируют разработку программного обеспечения, выполняя такие задачи, как разработка функций, отладка и тестирование. Несмотря на их растущее влияние, исследовательскому сообществу не хватает всеобъемлющего набора данных, фиксирующего использование этих агентов в реальных проектах. Чтобы восполнить этот пробел, мы представляем AIDev — масштабный набор данных, сфокусированный на пул-реквестах, созданных агентами (агентскими PR), в реальных репозиториях GitHub. AIDev агрегирует 932 791 агентский PR, созданный пятью агентами: OpenAI Codex, Devin, GitHub Copilot, Cursor и Claude Code. Эти PR охватывают 116 211 репозиториев и вовлекают 72 189 разработчиков. Кроме того, AIDev включает курируемое подмножество из 33 596 агентских PR из 2 807 репозиториев, имеющих более 100 звезд, с дополнительной информацией, такой как комментарии, ревью, коммиты и связанные issues. Этот набор данных закладывает основу для будущих исследований внедрения ИИ, производительности разработчиков и взаимодействия человека и ИИ в новую эпоху разработки ПО. > AI-агент, Агентский ИИ, Агент программирования, Агентское программирование, Агентская разработка ПО, Агентская инженерия
English
AI coding agents are rapidly transforming software engineering by performing tasks such as feature development, debugging, and testing. Despite their growing impact, the research community lacks a comprehensive dataset capturing how these agents are used in real-world projects. To address this gap, we introduce AIDev, a large-scale dataset focused on agent-authored pull requests (Agentic-PRs) in real-world GitHub repositories. AIDev aggregates 932,791 Agentic-PRs produced by five agents: OpenAI Codex, Devin, GitHub Copilot, Cursor, and Claude Code. These PRs span 116,211 repositories and involve 72,189 developers. In addition, AIDev includes a curated subset of 33,596 Agentic-PRs from 2,807 repositories with over 100 stars, providing further information such as comments, reviews, commits, and related issues. This dataset offers a foundation for future research on AI adoption, developer productivity, and human-AI collaboration in the new era of software engineering. > AI Agent, Agentic AI, Coding Agent, Agentic Coding, Agentic Software Engineering, Agentic Engineering
PDF23February 18, 2026