ChatPaper.aiChatPaper

Vooraf getrainde grote taalmodelen voor industriële besturing

Pre-Trained Large Language Models for Industrial Control

August 6, 2023
Auteurs: Lei Song, Chuheng Zhang, Li Zhao, Jiang Bian
cs.AI

Samenvatting

Voor industriële besturing is het ontwikkelen van hoogwaardige controllers met weinig voorbeelden en lage technische schuld aantrekkelijk. Foundation-modellen, die beschikken over rijke voorkennis verkregen uit voorafgaande training met een internet-schaal corpus, hebben het potentieel om een goede controller te zijn met de juiste prompts. In dit artikel nemen we HVAC (Verwarming, Ventilatie en Airconditioning) gebouwbeheersing als voorbeeld om het vermogen van GPT-4 (een van de toonaangevende foundation-modellen) als controller te onderzoeken. Om HVAC te besturen, verpakken we de taak als een taalspel door tekst aan GPT-4 te verstrekken die een korte beschrijving van de taak, enkele geselecteerde demonstraties en de huidige observatie bevat op elke stap, en voeren we de acties uit die door GPT-4 worden voorgesteld. We voeren een reeks experimenten uit om de volgende vragen te beantwoorden: 1) Hoe goed kan GPT-4 HVAC besturen? 2) Hoe goed kan GPT-4 generaliseren naar verschillende scenario's voor HVAC-besturing? 3) Hoe beïnvloeden verschillende delen van de tekstcontext de prestaties? Over het algemeen hebben we vastgesteld dat GPT-4 prestaties bereikt die vergelijkbaar zijn met RL-methoden met weinig voorbeelden en lage technische schuld, wat het potentieel aangeeft van het direct toepassen van foundation-modellen op industriële besturingstaken.
English
For industrial control, developing high-performance controllers with few samples and low technical debt is appealing. Foundation models, possessing rich prior knowledge obtained from pre-training with Internet-scale corpus, have the potential to be a good controller with proper prompts. In this paper, we take HVAC (Heating, Ventilation, and Air Conditioning) building control as an example to examine the ability of GPT-4 (one of the first-tier foundation models) as the controller. To control HVAC, we wrap the task as a language game by providing text including a short description for the task, several selected demonstrations, and the current observation to GPT-4 on each step and execute the actions responded by GPT-4. We conduct series of experiments to answer the following questions: 1)~How well can GPT-4 control HVAC? 2)~How well can GPT-4 generalize to different scenarios for HVAC control? 3) How different parts of the text context affect the performance? In general, we found GPT-4 achieves the performance comparable to RL methods with few samples and low technical debt, indicating the potential of directly applying foundation models to industrial control tasks.
PDF70February 8, 2026