Chronos: Imparare il Linguaggio delle Serie Temporali
Chronos: Learning the Language of Time Series
March 12, 2024
Autori: Abdul Fatir Ansari, Lorenzo Stella, Caner Turkmen, Xiyuan Zhang, Pedro Mercado, Huibin Shen, Oleksandr Shchur, Syama Sundar Rangapuram, Sebastian Pineda Arango, Shubham Kapoor, Jasper Zschiegner, Danielle C. Maddix, Michael W. Mahoney, Kari Torkkola, Andrew Gordon Wilson, Michael Bohlke-Schneider, Yuyang Wang
cs.AI
Abstract
Presentiamo Chronos, un framework semplice ma efficace per modelli probabilistici pre-addestrati su serie temporali. Chronos tokenizza i valori delle serie temporali utilizzando scalatura e quantizzazione in un vocabolario fisso e addestra architetture di modelli linguistici basati su transformer su queste serie temporali tokenizzate tramite la funzione di perdita di entropia incrociata. Abbiamo pre-addestrato i modelli Chronos basati sulla famiglia T5 (con un numero di parametri compreso tra 20M e 710M) su un'ampia raccolta di dataset pubblicamente disponibili, integrati da un dataset sintetico che abbiamo generato tramite processi gaussiani per migliorare la generalizzazione. In un benchmark completo composto da 42 dataset, che include sia modelli locali classici che metodi di deep learning, dimostriamo che i modelli Chronos: (a) superano significativamente altri metodi sui dataset che facevano parte del corpus di addestramento; e (b) hanno prestazioni zero-shot comparabili e occasionalmente superiori su nuovi dataset, rispetto a metodi che sono stati addestrati specificamente su di essi. I nostri risultati dimostrano che i modelli Chronos possono sfruttare dati di serie temporali provenienti da domini diversi per migliorare l'accuratezza zero-shot su task di previsione non visti, posizionando i modelli pre-addestrati come uno strumento valido per semplificare notevolmente le pipeline di previsione.
English
We introduce Chronos, a simple yet effective framework for pretrained
probabilistic time series models. Chronos tokenizes time series values using
scaling and quantization into a fixed vocabulary and trains existing
transformer-based language model architectures on these tokenized time series
via the cross-entropy loss. We pretrained Chronos models based on the T5 family
(ranging from 20M to 710M parameters) on a large collection of publicly
available datasets, complemented by a synthetic dataset that we generated via
Gaussian processes to improve generalization. In a comprehensive benchmark
consisting of 42 datasets, and comprising both classical local models and deep
learning methods, we show that Chronos models: (a) significantly outperform
other methods on datasets that were part of the training corpus; and (b) have
comparable and occasionally superior zero-shot performance on new datasets,
relative to methods that were trained specifically on them. Our results
demonstrate that Chronos models can leverage time series data from diverse
domains to improve zero-shot accuracy on unseen forecasting tasks, positioning
pretrained models as a viable tool to greatly simplify forecasting pipelines.