ChatPaper.aiChatPaper

Toto : Transformateur Optimisé pour les Séries Temporelles en Observabilité

Toto: Time Series Optimized Transformer for Observability

July 10, 2024
Auteurs: Ben Cohen, Emaad Khwaja, Kan Wang, Charles Masson, Elise Ramé, Youssef Doubli, Othmane Abou-Amal
cs.AI

Résumé

Ce rapport technique présente le Time Series Optimized Transformer for Observability (Toto), un nouveau modèle de base de pointe pour la prévision de séries temporelles développé par Datadog. En plus de repousser les limites de l'état de l'art sur des benchmarks généralisés de séries temporelles dans des domaines tels que l'électricité et la météorologie, ce modèle est le premier modèle de base polyvalent de prévision de séries temporelles spécifiquement optimisé pour les métriques d'observabilité. Toto a été entraîné sur un ensemble de données d'un billion de points de séries temporelles, le plus grand parmi tous les modèles de base de séries temporelles actuellement publiés. En plus des ensembles de données de séries temporelles disponibles publiquement, 75 % des données utilisées pour entraîner Toto proviennent de points de métriques numériques entièrement anonymisés de la plateforme Datadog. Dans nos expériences, Toto surpasse les modèles de base existants pour les séries temporelles sur les données d'observabilité. Il y parvient tout en excellant également dans les tâches de prévision polyvalentes, atteignant des performances de pointe en zero-shot sur plusieurs ensembles de données de référence ouverts.
English
This technical report describes the Time Series Optimized Transformer for Observability (Toto), a new state of the art foundation model for time series forecasting developed by Datadog. In addition to advancing the state of the art on generalized time series benchmarks in domains such as electricity and weather, this model is the first general-purpose time series forecasting foundation model to be specifically tuned for observability metrics. Toto was trained on a dataset of one trillion time series data points, the largest among all currently published time series foundation models. Alongside publicly available time series datasets, 75% of the data used to train Toto consists of fully anonymous numerical metric data points from the Datadog platform. In our experiments, Toto outperforms existing time series foundation models on observability data. It does this while also excelling at general-purpose forecasting tasks, achieving state-of-the-art zero-shot performance on multiple open benchmark datasets.

Summary

AI-Generated Summary

PDF333November 28, 2024