Sur l'utilisation du codage agentique : Une étude empirique des demandes de pull sur GitHub

papers.abstract

Les grands modèles de langage (LLM) sont de plus en plus intégrés dans les processus de développement logiciel. La capacité à générer du code et à soumettre des demandes de fusion (pull requests) avec une intervention humaine minimale, grâce à l'utilisation d'agents IA autonomes, est en passe de devenir une pratique standard. Cependant, on en sait peu sur l'utilité pratique de ces demandes de fusion et sur la mesure dans laquelle leurs contributions sont acceptées dans des projets réels. Dans cet article, nous étudions empiriquement 567 demandes de fusion (PR) générées à l'aide de Claude Code, un outil de codage agentique, dans 157 projets open source diversifiés. Notre analyse révèle que les développeurs ont tendance à s'appuyer sur les agents pour des tâches telles que le refactoring, la documentation et les tests. Les résultats indiquent que 83,8 % de ces PR assistées par des agents sont finalement acceptées et fusionnées par les mainteneurs de projet, avec 54,9 % des PR fusionnées intégrées sans modification supplémentaire. Les 45,1 % restants nécessitent des changements supplémentaires et bénéficient de révisions humaines, en particulier pour les corrections de bugs, la documentation et le respect des normes spécifiques au projet. Ces résultats suggèrent que, bien que les PR assistées par des agents soient largement acceptables, elles bénéficient encore de la supervision et de l'affinement humains.

English

Large language models (LLMs) are increasingly being integrated into software development processes. The ability to generate code and submit pull requests with minimal human intervention, through the use of autonomous AI agents, is poised to become a standard practice. However, little is known about the practical usefulness of these pull requests and the extent to which their contributions are accepted in real-world projects. In this paper, we empirically study 567 GitHub pull requests (PRs) generated using Claude Code, an agentic coding tool, across 157 diverse open-source projects. Our analysis reveals that developers tend to rely on agents for tasks such as refactoring, documentation, and testing. The results indicate that 83.8% of these agent-assisted PRs are eventually accepted and merged by project maintainers, with 54.9% of the merged PRs are integrated without further modification. The remaining 45.1% require additional changes benefit from human revisions, especially for bug fixes, documentation, and adherence to project-specific standards. These findings suggest that while agent-assisted PRs are largely acceptable, they still benefit from human oversight and refinement.

Sur l'utilisation du codage agentique : Une étude empirique des demandes de pull sur GitHub

On the Use of Agentic Coding: An Empirical Study of Pull Requests on GitHub

papers.abstract

Support