Rédaction de code assistée par IA multi-lignes

papers.abstract

CodeCompose est un outil de rédaction de code assisté par l'intelligence artificielle, alimenté par des modèles de langage de grande taille (LLMs), qui propose des suggestions en ligne à des dizaines de milliers de développeurs chez Meta. Dans cet article, nous présentons comment nous avons fait évoluer le produit pour passer de suggestions sur une seule ligne à des suggestions sur plusieurs lignes. Cette évolution nous a obligés à surmonter plusieurs défis uniques afin d'améliorer l'utilisabilité de ces suggestions pour les développeurs. Premièrement, nous discutons de l'effet « déstabilisant » que peuvent avoir les suggestions multi-lignes, car les propositions du LLM déplacent constamment le code existant du développeur, ce qui pourrait autrement entraîner une baisse de productivité et de satisfaction. Deuxièmement, les suggestions multi-lignes prennent significativement plus de temps à générer ; nous présentons donc plusieurs innovations que nous avons mises en œuvre pour réduire la latence perçue par les utilisateurs. Ces optimisations d'hébergement des modèles ont permis de réduire la latence des suggestions multi-lignes par un facteur de 2,5. Enfin, nous avons mené des expériences auprès de dizaines de milliers d'ingénieurs pour comprendre comment les suggestions multi-lignes impactent l'expérience utilisateur et les comparer aux suggestions sur une seule ligne. Nos expériences révèlent que (i) les suggestions multi-lignes représentent 42 % des caractères acceptés au total (bien qu'elles ne représentent que 16 % des suggestions affichées) et (ii) les suggestions multi-lignes ont presque doublé le pourcentage de frappes économisées pour les utilisateurs, passant de 9 % à 17 %. CodeCompose avec suggestions multi-lignes a été déployé auprès de tous les ingénieurs de Meta, et moins de 1 % des ingénieurs ont choisi de désactiver cette fonctionnalité.

English

CodeCompose is an AI-assisted code authoring tool powered by large language models (LLMs) that provides inline suggestions to 10's of thousands of developers at Meta. In this paper, we present how we scaled the product from displaying single-line suggestions to multi-line suggestions. This evolution required us to overcome several unique challenges in improving the usability of these suggestions for developers. First, we discuss how multi-line suggestions can have a 'jarring' effect, as the LLM's suggestions constantly move around the developer's existing code, which would otherwise result in decreased productivity and satisfaction. Second, multi-line suggestions take significantly longer to generate; hence we present several innovative investments we made to reduce the perceived latency for users. These model-hosting optimizations sped up multi-line suggestion latency by 2.5x. Finally, we conduct experiments on 10's of thousands of engineers to understand how multi-line suggestions impact the user experience and contrast this with single-line suggestions. Our experiments reveal that (i) multi-line suggestions account for 42% of total characters accepted (despite only accounting for 16% for displayed suggestions) (ii) multi-line suggestions almost doubled the percentage of keystrokes saved for users from 9% to 17%. Multi-line CodeCompose has been rolled out to all engineers at Meta, and less than 1% of engineers have opted out of multi-line suggestions.

Rédaction de code assistée par IA multi-lignes

Multi-line AI-assisted Code Authoring

papers.abstract

Support