Vooraf getrainde grote taalmodelen voor industriële besturing
Pre-Trained Large Language Models for Industrial Control
August 6, 2023
Auteurs: Lei Song, Chuheng Zhang, Li Zhao, Jiang Bian
cs.AI
Samenvatting
Voor industriële besturing is het ontwikkelen van hoogwaardige controllers met weinig voorbeelden en lage technische schuld aantrekkelijk. Foundation-modellen, die beschikken over rijke voorkennis verkregen uit voorafgaande training met een internet-schaal corpus, hebben het potentieel om een goede controller te zijn met de juiste prompts. In dit artikel nemen we HVAC (Verwarming, Ventilatie en Airconditioning) gebouwbeheersing als voorbeeld om het vermogen van GPT-4 (een van de toonaangevende foundation-modellen) als controller te onderzoeken. Om HVAC te besturen, verpakken we de taak als een taalspel door tekst aan GPT-4 te verstrekken die een korte beschrijving van de taak, enkele geselecteerde demonstraties en de huidige observatie bevat op elke stap, en voeren we de acties uit die door GPT-4 worden voorgesteld. We voeren een reeks experimenten uit om de volgende vragen te beantwoorden: 1) Hoe goed kan GPT-4 HVAC besturen? 2) Hoe goed kan GPT-4 generaliseren naar verschillende scenario's voor HVAC-besturing? 3) Hoe beïnvloeden verschillende delen van de tekstcontext de prestaties? Over het algemeen hebben we vastgesteld dat GPT-4 prestaties bereikt die vergelijkbaar zijn met RL-methoden met weinig voorbeelden en lage technische schuld, wat het potentieel aangeeft van het direct toepassen van foundation-modellen op industriële besturingstaken.
English
For industrial control, developing high-performance controllers with few
samples and low technical debt is appealing. Foundation models, possessing rich
prior knowledge obtained from pre-training with Internet-scale corpus, have the
potential to be a good controller with proper prompts. In this paper, we take
HVAC (Heating, Ventilation, and Air Conditioning) building control as an
example to examine the ability of GPT-4 (one of the first-tier foundation
models) as the controller. To control HVAC, we wrap the task as a language game
by providing text including a short description for the task, several selected
demonstrations, and the current observation to GPT-4 on each step and execute
the actions responded by GPT-4. We conduct series of experiments to answer the
following questions: 1)~How well can GPT-4 control HVAC? 2)~How well can GPT-4
generalize to different scenarios for HVAC control? 3) How different parts of
the text context affect the performance? In general, we found GPT-4 achieves
the performance comparable to RL methods with few samples and low technical
debt, indicating the potential of directly applying foundation models to
industrial control tasks.