ChatPaper.aiChatPaper

Хронос: Изучение языка временных рядов

Chronos: Learning the Language of Time Series

March 12, 2024
Авторы: Abdul Fatir Ansari, Lorenzo Stella, Caner Turkmen, Xiyuan Zhang, Pedro Mercado, Huibin Shen, Oleksandr Shchur, Syama Sundar Rangapuram, Sebastian Pineda Arango, Shubham Kapoor, Jasper Zschiegner, Danielle C. Maddix, Michael W. Mahoney, Kari Torkkola, Andrew Gordon Wilson, Michael Bohlke-Schneider, Yuyang Wang
cs.AI

Аннотация

Мы представляем Chronos - простую, но эффективную структуру для предварительно обученных вероятностных моделей временных рядов. Chronos токенизирует значения временных рядов с использованием масштабирования и квантования в фиксированный словарь, обучает существующие архитектуры моделей на основе трансформера на этих токенизированных временных рядах с использованием потерь кросс-энтропии. Мы предварительно обучили модели Chronos на основе семейства T5 (от 20 млн до 710 млн параметров) на большой коллекции общедоступных наборов данных, дополненных синтетическим набором данных, созданным с использованием гауссовских процессов для улучшения обобщения. В рамках обширного тестирования, включающего 42 набора данных и охватывающего как классические локальные модели, так и методы глубокого обучения, мы показываем, что модели Chronos: (a) значительно превосходят другие методы на наборах данных, входящих в обучающий корпус; и (b) обладают сравнимой и иногда превосходящей производительностью на новых наборах данных при нулевой настройке, по сравнению с методами, которые были обучены специально на них. Наши результаты демонстрируют, что модели Chronos могут использовать данные временных рядов из различных областей для улучшения точности при нулевой настройке на невидимые задачи прогнозирования, позиционируя предварительно обученные модели как эффективный инструмент для значительного упрощения процессов прогнозирования.
English
We introduce Chronos, a simple yet effective framework for pretrained probabilistic time series models. Chronos tokenizes time series values using scaling and quantization into a fixed vocabulary and trains existing transformer-based language model architectures on these tokenized time series via the cross-entropy loss. We pretrained Chronos models based on the T5 family (ranging from 20M to 710M parameters) on a large collection of publicly available datasets, complemented by a synthetic dataset that we generated via Gaussian processes to improve generalization. In a comprehensive benchmark consisting of 42 datasets, and comprising both classical local models and deep learning methods, we show that Chronos models: (a) significantly outperform other methods on datasets that were part of the training corpus; and (b) have comparable and occasionally superior zero-shot performance on new datasets, relative to methods that were trained specifically on them. Our results demonstrate that Chronos models can leverage time series data from diverse domains to improve zero-shot accuracy on unseen forecasting tasks, positioning pretrained models as a viable tool to greatly simplify forecasting pipelines.

Summary

AI-Generated Summary

PDF485December 15, 2024