ChatPaper.aiChatPaper

이번에는 다르다: 시계열 파운데이션 모델의 관측 가능성 관점

This Time is Different: An Observability Perspective on Time Series Foundation Models

May 20, 2025
저자: Ben Cohen, Emaad Khwaja, Youssef Doubli, Salahidine Lemaachi, Chris Lettieri, Charles Masson, Hugo Miccinilli, Elise Ramé, Qiqi Ren, Afshin Rostamizadeh, Jean Ogier du Terrail, Anna-Monica Toon, Kan Wang, Stephan Xie, David Asker, Ameet Talwalkar, Othmane Abou-Amal
cs.AI

초록

151백만 개의 파라미터를 가진 시계열 예측 기반 모델인 Toto를 소개합니다. Toto는 최신 디코더 전용 아키텍처를 사용하며, 다변량 관측 가능성 시계열 데이터에서 발견되는 특정 문제를 해결하기 위한 아키텍처 혁신을 도입했습니다. Toto의 사전 학습 코퍼스는 관측 가능성 데이터, 공개 데이터셋, 그리고 합성 데이터의 혼합으로 구성되어 있으며, 주요 시계열 기반 모델들의 코퍼스보다 4~10배 더 큽니다. 또한, 2,807개의 실제 시계열 데이터에 걸쳐 3억 5천만 개의 관측치를 포함하는 대규모 벤치마크인 BOOM을 소개합니다. Toto와 BOOM 모두에서 사용된 관측 가능성 데이터는 Datadog의 자체 원격 측정 및 내부 관측 가능성 메트릭에서 독점적으로 수집되었습니다. 광범위한 평가 결과, Toto는 BOOM뿐만 아니라 기존의 일반 목적 시계열 예측 벤치마크에서도 최첨단 성능을 달성함을 보여줍니다. Toto의 모델 가중치, 추론 코드, 평가 스크립트, 그리고 BOOM의 데이터와 평가 코드는 모두 Apache 2.0 라이선스 하에 오픈 소스로 제공되며, https://huggingface.co/Datadog/Toto-Open-Base-1.0와 https://github.com/DataDog/toto에서 확인할 수 있습니다.
English
We introduce Toto, a time series forecasting foundation model with 151 million parameters. Toto uses a modern decoder-only architecture coupled with architectural innovations designed to account for specific challenges found in multivariate observability time series data. Toto's pre-training corpus is a mixture of observability data, open datasets, and synthetic data, and is 4-10times larger than those of leading time series foundation models. Additionally, we introduce BOOM, a large-scale benchmark consisting of 350 million observations across 2,807 real-world time series. For both Toto and BOOM, we source observability data exclusively from Datadog's own telemetry and internal observability metrics. Extensive evaluations demonstrate that Toto achieves state-of-the-art performance on both BOOM and on established general purpose time series forecasting benchmarks. Toto's model weights, inference code, and evaluation scripts, as well as BOOM's data and evaluation code, are all available as open source under the Apache 2.0 License available at https://huggingface.co/Datadog/Toto-Open-Base-1.0 and https://github.com/DataDog/toto.

Summary

AI-Generated Summary

PDF323May 22, 2025