Vortrainierte große Sprachmodelle für die industrielle Steuerung

papers.abstract

Für die industrielle Steuerung ist die Entwicklung von Hochleistungsreglern mit wenigen Proben und geringem technischen Schuldenstand attraktiv. Foundation-Modelle, die über umfangreiches Vorwissen verfügen, das durch Vorabtraining mit internetgroßen Datensätzen erworben wurde, haben das Potenzial, bei geeigneter Prompt-Gestaltung gute Regler zu sein. In diesem Artikel nehmen wir die Gebäudesteuerung von HVAC (Heizung, Lüftung und Klimatisierung) als Beispiel, um die Fähigkeit von GPT-4 (eines der erstklassigen Foundation-Modelle) als Regler zu untersuchen. Um HVAC zu steuern, verpacken wir die Aufgabe als Sprachspiel, indem wir GPT-4 bei jedem Schritt einen Text bereitstellen, der eine kurze Beschreibung der Aufgabe, mehrere ausgewählte Demonstrationen und die aktuelle Beobachtung enthält, und die von GPT-4 zurückgegebenen Aktionen ausführen. Wir führen eine Reihe von Experimenten durch, um die folgenden Fragen zu beantworten: 1) Wie gut kann GPT-4 HVAC steuern? 2) Wie gut kann GPT-4 auf verschiedene Szenarien der HVAC-Steuerung verallgemeinern? 3) Wie beeinflussen verschiedene Teile des Textkontexts die Leistung? Im Allgemeinen stellen wir fest, dass GPT-4 eine mit RL-Methoden vergleichbare Leistung mit wenigen Proben und geringem technischen Schuldenstand erreicht, was das Potenzial der direkten Anwendung von Foundation-Modellen auf industrielle Steuerungsaufgaben aufzeigt.

English

For industrial control, developing high-performance controllers with few samples and low technical debt is appealing. Foundation models, possessing rich prior knowledge obtained from pre-training with Internet-scale corpus, have the potential to be a good controller with proper prompts. In this paper, we take HVAC (Heating, Ventilation, and Air Conditioning) building control as an example to examine the ability of GPT-4 (one of the first-tier foundation models) as the controller. To control HVAC, we wrap the task as a language game by providing text including a short description for the task, several selected demonstrations, and the current observation to GPT-4 on each step and execute the actions responded by GPT-4. We conduct series of experiments to answer the following questions: 1)~How well can GPT-4 control HVAC? 2)~How well can GPT-4 generalize to different scenarios for HVAC control? 3) How different parts of the text context affect the performance? In general, we found GPT-4 achieves the performance comparable to RL methods with few samples and low technical debt, indicating the potential of directly applying foundation models to industrial control tasks.

Vortrainierte große Sprachmodelle für die industrielle Steuerung

Pre-Trained Large Language Models for Industrial Control

papers.abstract

Support