Modelli Linguistici Pre-addestrati di Grandi Dimensioni per il Controllo Industriale

Abstract

Nel contesto del controllo industriale, lo sviluppo di controller ad alte prestazioni con pochi campioni e un basso debito tecnico è particolarmente interessante. I modelli di base, dotati di una ricca conoscenza a priori ottenuta attraverso il pre-addestramento su corpus di scala Internet, hanno il potenziale per diventare ottimi controller se adeguatamente guidati da prompt. In questo articolo, prendiamo come esempio il controllo HVAC (Riscaldamento, Ventilazione e Condizionamento dell'Aria) negli edifici per esaminare le capacità di GPT-4 (uno dei modelli di base di prima fascia) come controller. Per controllare l'HVAC, abbiamo incapsulato il compito come un gioco linguistico, fornendo a GPT-4, ad ogni passo, un testo che include una breve descrizione del compito, diverse dimostrazioni selezionate e l'osservazione corrente, eseguendo poi le azioni restituite da GPT-4. Abbiamo condotto una serie di esperimenti per rispondere alle seguenti domande: 1) Quanto bene può GPT-4 controllare l'HVAC? 2) Quanto bene può GPT-4 generalizzare a diversi scenari di controllo HVAC? 3) In che modo le diverse parti del contesto testuale influenzano le prestazioni? In generale, abbiamo riscontrato che GPT-4 raggiunge prestazioni paragonabili ai metodi di apprendimento per rinforzo (RL) con pochi campioni e un basso debito tecnico, indicando il potenziale di applicazione diretta dei modelli di base ai compiti di controllo industriale.

English

For industrial control, developing high-performance controllers with few samples and low technical debt is appealing. Foundation models, possessing rich prior knowledge obtained from pre-training with Internet-scale corpus, have the potential to be a good controller with proper prompts. In this paper, we take HVAC (Heating, Ventilation, and Air Conditioning) building control as an example to examine the ability of GPT-4 (one of the first-tier foundation models) as the controller. To control HVAC, we wrap the task as a language game by providing text including a short description for the task, several selected demonstrations, and the current observation to GPT-4 on each step and execute the actions responded by GPT-4. We conduct series of experiments to answer the following questions: 1)~How well can GPT-4 control HVAC? 2)~How well can GPT-4 generalize to different scenarios for HVAC control? 3) How different parts of the text context affect the performance? In general, we found GPT-4 achieves the performance comparable to RL methods with few samples and low technical debt, indicating the potential of directly applying foundation models to industrial control tasks.

Modelli Linguistici Pre-addestrati di Grandi Dimensioni per il Controllo Industriale

Pre-Trained Large Language Models for Industrial Control

Abstract

Support