Chronos: 時系列の言語を学ぶ

Chronos: Learning the Language of Time Series

March 12, 2024
著者: Abdul Fatir Ansari, Lorenzo Stella, Caner Turkmen, Xiyuan Zhang, Pedro Mercado, Huibin Shen, Oleksandr Shchur, Syama Sundar Rangapuram, Sebastian Pineda Arango, Shubham Kapoor, Jasper Zschiegner, Danielle C. Maddix, Michael W. Mahoney, Kari Torkkola, Andrew Gordon Wilson, Michael Bohlke-Schneider, Yuyang Wang
cs.AI

要旨

Chronosを紹介します。これは、事前学習済みの確率的時系列モデルのためのシンプルかつ効果的なフレームワークです。Chronosは、スケーリングと量子化を用いて時系列値を固定語彙にトークン化し、これらのトークン化された時系列に対して既存のTransformerベースの言語モデルアーキテクチャを交差エントロピー損失を用いて学習します。Chronosモデルは、T5ファミリー(2000万から7億1000万パラメータまで)を基に、公開されている大規模なデータセットのコレクションで事前学習を行い、汎化性能を向上させるためにガウス過程を用いて生成した合成データセットを補完しました。42のデータセットからなる包括的なベンチマークにおいて、古典的なローカルモデルと深層学習手法の両方を含む比較を行った結果、Chronosモデルは以下の点を示しました:(a) 学習コーパスに含まれるデータセットにおいて他の手法を大幅に上回る性能を発揮し、(b) 新しいデータセットに対するゼロショット性能が、それらのデータセットに特化して学習された手法と同等か、場合によっては優れていることです。これらの結果は、Chronosモデルが多様なドメインの時系列データを活用して未見の予測タスクにおけるゼロショット精度を向上させることができ、事前学習済みモデルが予測パイプラインを大幅に簡素化する有効なツールとして位置づけられることを示しています。
English
We introduce Chronos, a simple yet effective framework for pretrained probabilistic time series models. Chronos tokenizes time series values using scaling and quantization into a fixed vocabulary and trains existing transformer-based language model architectures on these tokenized time series via the cross-entropy loss. We pretrained Chronos models based on the T5 family (ranging from 20M to 710M parameters) on a large collection of publicly available datasets, complemented by a synthetic dataset that we generated via Gaussian processes to improve generalization. In a comprehensive benchmark consisting of 42 datasets, and comprising both classical local models and deep learning methods, we show that Chronos models: (a) significantly outperform other methods on datasets that were part of the training corpus; and (b) have comparable and occasionally superior zero-shot performance on new datasets, relative to methods that were trained specifically on them. Our results demonstrate that Chronos models can leverage time series data from diverse domains to improve zero-shot accuracy on unseen forecasting tasks, positioning pretrained models as a viable tool to greatly simplify forecasting pipelines.

Summary

AI-Generated Summary

PDF485December 15, 2024