産業制御のための事前学習済み大規模言語モデル
Pre-Trained Large Language Models for Industrial Control
August 6, 2023
著者: Lei Song, Chuheng Zhang, Li Zhao, Jiang Bian
cs.AI
要旨
産業制御において、少ないサンプル数と低い技術的負債で高性能なコントローラを開発することは魅力的です。インターネット規模のコーパスを用いた事前学習から得られた豊富な事前知識を持つファウンデーションモデルは、適切なプロンプトを与えることで優れたコントローラとなる可能性があります。本論文では、HVAC(暖房、換気、空調)の建物制御を例として、第一線級のファウンデーションモデルであるGPT-4の制御能力を検証します。HVACを制御するために、タスクの短い説明、いくつかの選択されたデモンストレーション、および現在の観測値を含むテキストを各ステップでGPT-4に提供し、GPT-4が応答したアクションを実行するという言語ゲームとしてタスクをラップします。以下の質問に答えるために一連の実験を行います:1) GPT-4はHVACをどの程度うまく制御できるか? 2) GPT-4はHVAC制御の異なるシナリオにどの程度汎化できるか? 3) テキストコンテキストの異なる部分が性能にどのように影響するか? 全般的に、GPT-4は少ないサンプル数と低い技術的負債でRL(強化学習)手法に匹敵する性能を達成し、ファウンデーションモデルを産業制御タスクに直接適用する可能性を示唆しています。
English
For industrial control, developing high-performance controllers with few
samples and low technical debt is appealing. Foundation models, possessing rich
prior knowledge obtained from pre-training with Internet-scale corpus, have the
potential to be a good controller with proper prompts. In this paper, we take
HVAC (Heating, Ventilation, and Air Conditioning) building control as an
example to examine the ability of GPT-4 (one of the first-tier foundation
models) as the controller. To control HVAC, we wrap the task as a language game
by providing text including a short description for the task, several selected
demonstrations, and the current observation to GPT-4 on each step and execute
the actions responded by GPT-4. We conduct series of experiments to answer the
following questions: 1)~How well can GPT-4 control HVAC? 2)~How well can GPT-4
generalize to different scenarios for HVAC control? 3) How different parts of
the text context affect the performance? In general, we found GPT-4 achieves
the performance comparable to RL methods with few samples and low technical
debt, indicating the potential of directly applying foundation models to
industrial control tasks.