Modelli Linguistici Pre-addestrati di Grandi Dimensioni per il Controllo Industriale
Pre-Trained Large Language Models for Industrial Control
August 6, 2023
Autori: Lei Song, Chuheng Zhang, Li Zhao, Jiang Bian
cs.AI
Abstract
Nel contesto del controllo industriale, lo sviluppo di controller ad alte prestazioni con pochi campioni e un basso debito tecnico è particolarmente interessante. I modelli di base, dotati di una ricca conoscenza a priori ottenuta attraverso il pre-addestramento su corpus di scala Internet, hanno il potenziale per diventare ottimi controller se adeguatamente guidati da prompt. In questo articolo, prendiamo come esempio il controllo HVAC (Riscaldamento, Ventilazione e Condizionamento dell'Aria) negli edifici per esaminare le capacità di GPT-4 (uno dei modelli di base di prima fascia) come controller. Per controllare l'HVAC, abbiamo incapsulato il compito come un gioco linguistico, fornendo a GPT-4, ad ogni passo, un testo che include una breve descrizione del compito, diverse dimostrazioni selezionate e l'osservazione corrente, eseguendo poi le azioni restituite da GPT-4. Abbiamo condotto una serie di esperimenti per rispondere alle seguenti domande: 1) Quanto bene può GPT-4 controllare l'HVAC? 2) Quanto bene può GPT-4 generalizzare a diversi scenari di controllo HVAC? 3) In che modo le diverse parti del contesto testuale influenzano le prestazioni? In generale, abbiamo riscontrato che GPT-4 raggiunge prestazioni paragonabili ai metodi di apprendimento per rinforzo (RL) con pochi campioni e un basso debito tecnico, indicando il potenziale di applicazione diretta dei modelli di base ai compiti di controllo industriale.
English
For industrial control, developing high-performance controllers with few
samples and low technical debt is appealing. Foundation models, possessing rich
prior knowledge obtained from pre-training with Internet-scale corpus, have the
potential to be a good controller with proper prompts. In this paper, we take
HVAC (Heating, Ventilation, and Air Conditioning) building control as an
example to examine the ability of GPT-4 (one of the first-tier foundation
models) as the controller. To control HVAC, we wrap the task as a language game
by providing text including a short description for the task, several selected
demonstrations, and the current observation to GPT-4 on each step and execute
the actions responded by GPT-4. We conduct series of experiments to answer the
following questions: 1)~How well can GPT-4 control HVAC? 2)~How well can GPT-4
generalize to different scenarios for HVAC control? 3) How different parts of
the text context affect the performance? In general, we found GPT-4 achieves
the performance comparable to RL methods with few samples and low technical
debt, indicating the potential of directly applying foundation models to
industrial control tasks.