Generación Automatizada de Código para Tareas de Tecnologías de la Información en YAML mediante Modelos de Lenguaje de Gran Escala
Automated Code generation for Information Technology Tasks in YAML through Large Language Models
May 2, 2023
Autores: Saurabh Pujar, Luca Buratti, Xiaojie Guo, Nicolas Dupuis, Burn Lewis, Sahil Suneja, Atin Sood, Ganesh Nalawade, Matt Jones, Alessandro Morari, Ruchir Puri
cs.AI
Resumen
La reciente mejora en las capacidades de generación de código, gracias al uso de modelos de lenguaje de gran escala, ha beneficiado principalmente a los lenguajes de programación de propósito general. Los lenguajes específicos de dominio, como los utilizados para la automatización de TI, han recibido mucha menos atención, a pesar de involucrar a muchos desarrolladores activos y ser un componente esencial de las plataformas en la nube modernas. Este trabajo se centra en la generación de Ansible-YAML, un lenguaje de marcado ampliamente utilizado para la automatización de TI. Presentamos Ansible Wisdom, una herramienta de generación de código de lenguaje natural a Ansible-YAML, diseñada para mejorar la productividad en la automatización de TI. Ansible Wisdom es un modelo basado en transformadores, ampliado mediante el entrenamiento con un nuevo conjunto de datos que contiene Ansible-YAML. También desarrollamos dos métricas de rendimiento novedosas para YAML y Ansible, con el fin de capturar las características específicas de este dominio. Los resultados muestran que Ansible Wisdom puede generar con precisión scripts de Ansible a partir de instrucciones en lenguaje natural, con un rendimiento comparable o superior al de los modelos de generación de código más avanzados existentes.
English
The recent improvement in code generation capabilities due to the use of
large language models has mainly benefited general purpose programming
languages. Domain specific languages, such as the ones used for IT Automation,
have received far less attention, despite involving many active developers and
being an essential component of modern cloud platforms. This work focuses on
the generation of Ansible-YAML, a widely used markup language for IT
Automation. We present Ansible Wisdom, a natural-language to Ansible-YAML code
generation tool, aimed at improving IT automation productivity. Ansible Wisdom
is a transformer-based model, extended by training with a new dataset
containing Ansible-YAML. We also develop two novel performance metrics for YAML
and Ansible to capture the specific characteristics of this domain. Results
show that Ansible Wisdom can accurately generate Ansible script from natural
language prompts with performance comparable or better than existing state of
the art code generation models.