ChatPaper.aiChatPaper

Chronos: Het leren van de taal van tijdreeksen

Chronos: Learning the Language of Time Series

March 12, 2024
Auteurs: Abdul Fatir Ansari, Lorenzo Stella, Caner Turkmen, Xiyuan Zhang, Pedro Mercado, Huibin Shen, Oleksandr Shchur, Syama Sundar Rangapuram, Sebastian Pineda Arango, Shubham Kapoor, Jasper Zschiegner, Danielle C. Maddix, Michael W. Mahoney, Kari Torkkola, Andrew Gordon Wilson, Michael Bohlke-Schneider, Yuyang Wang
cs.AI

Samenvatting

We introduceren Chronos, een eenvoudig maar effectief raamwerk voor voorgetrainde probabilistische tijdreeksmodellen. Chronos tokeniseert tijdreekswaarden door middel van schaling en kwantisering in een vaste vocabulaire en traint bestaande transformer-gebaseerde taalmodelarchitecturen op deze getokeniseerde tijdreeksen via het kruis-entropieverlies. We hebben Chronos-modellen voorgetraind op basis van de T5-familie (variërend van 20M tot 710M parameters) op een grote verzameling publiek beschikbare datasets, aangevuld met een synthetische dataset die we hebben gegenereerd via Gaussische processen om de generalisatie te verbeteren. In een uitgebreide benchmark bestaande uit 42 datasets, en omvattende zowel klassieke lokale modellen als deep learning-methoden, laten we zien dat Chronos-modellen: (a) significant beter presteren dan andere methoden op datasets die deel uitmaakten van de trainingscorpus; en (b) vergelijkbare en soms superieure zero-shot prestaties hebben op nieuwe datasets, in vergelijking met methoden die specifiek daarop zijn getraind. Onze resultaten tonen aan dat Chronos-modellen tijdreeksgegevens uit diverse domeinen kunnen benutten om de zero-shot nauwkeurigheid op onbekende voorspellingstaken te verbeteren, waardoor voorgetrainde modellen zich positioneren als een haalbaar instrument om voorspellingspijplijnen aanzienlijk te vereenvoudigen.
English
We introduce Chronos, a simple yet effective framework for pretrained probabilistic time series models. Chronos tokenizes time series values using scaling and quantization into a fixed vocabulary and trains existing transformer-based language model architectures on these tokenized time series via the cross-entropy loss. We pretrained Chronos models based on the T5 family (ranging from 20M to 710M parameters) on a large collection of publicly available datasets, complemented by a synthetic dataset that we generated via Gaussian processes to improve generalization. In a comprehensive benchmark consisting of 42 datasets, and comprising both classical local models and deep learning methods, we show that Chronos models: (a) significantly outperform other methods on datasets that were part of the training corpus; and (b) have comparable and occasionally superior zero-shot performance on new datasets, relative to methods that were trained specifically on them. Our results demonstrate that Chronos models can leverage time series data from diverse domains to improve zero-shot accuracy on unseen forecasting tasks, positioning pretrained models as a viable tool to greatly simplify forecasting pipelines.
PDF475February 8, 2026