Modelos de Lenguaje Preentrenados a Gran Escala para Control Industrial

Resumen

Para el control industrial, desarrollar controladores de alto rendimiento con pocas muestras y baja deuda técnica es muy atractivo. Los modelos fundacionales, que poseen un conocimiento previo rico obtenido del preentrenamiento con corpus a escala de Internet, tienen el potencial de ser buenos controladores con las indicaciones adecuadas. En este artículo, tomamos el control de edificios HVAC (Calefacción, Ventilación y Aire Acondicionado) como ejemplo para examinar la capacidad de GPT-4 (uno de los modelos fundacionales de primer nivel) como controlador. Para controlar HVAC, enmarcamos la tarea como un juego de lenguaje proporcionando texto que incluye una breve descripción de la tarea, varias demostraciones seleccionadas y la observación actual a GPT-4 en cada paso, y ejecutamos las acciones respondidas por GPT-4. Realizamos una serie de experimentos para responder las siguientes preguntas: 1) ¿Qué tan bien puede GPT-4 controlar HVAC? 2) ¿Qué tan bien puede GPT-4 generalizar a diferentes escenarios para el control de HVAC? 3) ¿Cómo afectan las diferentes partes del contexto textual al rendimiento? En general, encontramos que GPT-4 alcanza un rendimiento comparable a los métodos de aprendizaje por refuerzo (RL) con pocas muestras y baja deuda técnica, lo que indica el potencial de aplicar directamente modelos fundacionales a tareas de control industrial.

English

For industrial control, developing high-performance controllers with few samples and low technical debt is appealing. Foundation models, possessing rich prior knowledge obtained from pre-training with Internet-scale corpus, have the potential to be a good controller with proper prompts. In this paper, we take HVAC (Heating, Ventilation, and Air Conditioning) building control as an example to examine the ability of GPT-4 (one of the first-tier foundation models) as the controller. To control HVAC, we wrap the task as a language game by providing text including a short description for the task, several selected demonstrations, and the current observation to GPT-4 on each step and execute the actions responded by GPT-4. We conduct series of experiments to answer the following questions: 1)~How well can GPT-4 control HVAC? 2)~How well can GPT-4 generalize to different scenarios for HVAC control? 3) How different parts of the text context affect the performance? In general, we found GPT-4 achieves the performance comparable to RL methods with few samples and low technical debt, indicating the potential of directly applying foundation models to industrial control tasks.

Modelos de Lenguaje Preentrenados a Gran Escala para Control Industrial

Pre-Trained Large Language Models for Industrial Control

Resumen

Support