Chronos: Aprendendo a Linguagem das Séries Temporais
Chronos: Learning the Language of Time Series
March 12, 2024
Autores: Abdul Fatir Ansari, Lorenzo Stella, Caner Turkmen, Xiyuan Zhang, Pedro Mercado, Huibin Shen, Oleksandr Shchur, Syama Sundar Rangapuram, Sebastian Pineda Arango, Shubham Kapoor, Jasper Zschiegner, Danielle C. Maddix, Michael W. Mahoney, Kari Torkkola, Andrew Gordon Wilson, Michael Bohlke-Schneider, Yuyang Wang
cs.AI
Resumo
Apresentamos o Chronos, uma estrutura simples, porém eficaz, para modelos probabilísticos de séries temporais pré-treinados. O Chronos tokeniza os valores das séries temporais utilizando escalonamento e quantização em um vocabulário fixo e treina arquiteturas de modelos de linguagem baseadas em transformers sobre essas séries temporais tokenizadas por meio da função de perda de entropia cruzada. Pré-treinamos modelos Chronos baseados na família T5 (variando de 20M a 710M parâmetros) em uma grande coleção de conjuntos de dados publicamente disponíveis, complementados por um conjunto de dados sintéticos que geramos por meio de processos gaussianos para melhorar a generalização. Em um benchmark abrangente composto por 42 conjuntos de dados, e incluindo tanto modelos clássicos locais quanto métodos de aprendizado profundo, mostramos que os modelos Chronos: (a) superam significativamente outros métodos em conjuntos de dados que faziam parte do corpus de treinamento; e (b) têm desempenho comparável e ocasionalmente superior em zero-shot em novos conjuntos de dados, em relação a métodos que foram treinados especificamente neles. Nossos resultados demonstram que os modelos Chronos podem aproveitar dados de séries temporais de diversos domínios para melhorar a precisão em zero-shot em tarefas de previsão não vistas, posicionando modelos pré-treinados como uma ferramenta viável para simplificar consideravelmente os pipelines de previsão.
English
We introduce Chronos, a simple yet effective framework for pretrained
probabilistic time series models. Chronos tokenizes time series values using
scaling and quantization into a fixed vocabulary and trains existing
transformer-based language model architectures on these tokenized time series
via the cross-entropy loss. We pretrained Chronos models based on the T5 family
(ranging from 20M to 710M parameters) on a large collection of publicly
available datasets, complemented by a synthetic dataset that we generated via
Gaussian processes to improve generalization. In a comprehensive benchmark
consisting of 42 datasets, and comprising both classical local models and deep
learning methods, we show that Chronos models: (a) significantly outperform
other methods on datasets that were part of the training corpus; and (b) have
comparable and occasionally superior zero-shot performance on new datasets,
relative to methods that were trained specifically on them. Our results
demonstrate that Chronos models can leverage time series data from diverse
domains to improve zero-shot accuracy on unseen forecasting tasks, positioning
pretrained models as a viable tool to greatly simplify forecasting pipelines.