Vortrainierte große Sprachmodelle für die industrielle Steuerung
Pre-Trained Large Language Models for Industrial Control
August 6, 2023
papers.authors: Lei Song, Chuheng Zhang, Li Zhao, Jiang Bian
cs.AI
papers.abstract
Für die industrielle Steuerung ist die Entwicklung von Hochleistungsreglern mit wenigen Proben und geringem technischen Schuldenstand attraktiv. Foundation-Modelle, die über umfangreiches Vorwissen verfügen, das durch Vorabtraining mit internetgroßen Datensätzen erworben wurde, haben das Potenzial, bei geeigneter Prompt-Gestaltung gute Regler zu sein. In diesem Artikel nehmen wir die Gebäudesteuerung von HVAC (Heizung, Lüftung und Klimatisierung) als Beispiel, um die Fähigkeit von GPT-4 (eines der erstklassigen Foundation-Modelle) als Regler zu untersuchen. Um HVAC zu steuern, verpacken wir die Aufgabe als Sprachspiel, indem wir GPT-4 bei jedem Schritt einen Text bereitstellen, der eine kurze Beschreibung der Aufgabe, mehrere ausgewählte Demonstrationen und die aktuelle Beobachtung enthält, und die von GPT-4 zurückgegebenen Aktionen ausführen. Wir führen eine Reihe von Experimenten durch, um die folgenden Fragen zu beantworten: 1) Wie gut kann GPT-4 HVAC steuern? 2) Wie gut kann GPT-4 auf verschiedene Szenarien der HVAC-Steuerung verallgemeinern? 3) Wie beeinflussen verschiedene Teile des Textkontexts die Leistung? Im Allgemeinen stellen wir fest, dass GPT-4 eine mit RL-Methoden vergleichbare Leistung mit wenigen Proben und geringem technischen Schuldenstand erreicht, was das Potenzial der direkten Anwendung von Foundation-Modellen auf industrielle Steuerungsaufgaben aufzeigt.
English
For industrial control, developing high-performance controllers with few
samples and low technical debt is appealing. Foundation models, possessing rich
prior knowledge obtained from pre-training with Internet-scale corpus, have the
potential to be a good controller with proper prompts. In this paper, we take
HVAC (Heating, Ventilation, and Air Conditioning) building control as an
example to examine the ability of GPT-4 (one of the first-tier foundation
models) as the controller. To control HVAC, we wrap the task as a language game
by providing text including a short description for the task, several selected
demonstrations, and the current observation to GPT-4 on each step and execute
the actions responded by GPT-4. We conduct series of experiments to answer the
following questions: 1)~How well can GPT-4 control HVAC? 2)~How well can GPT-4
generalize to different scenarios for HVAC control? 3) How different parts of
the text context affect the performance? In general, we found GPT-4 achieves
the performance comparable to RL methods with few samples and low technical
debt, indicating the potential of directly applying foundation models to
industrial control tasks.