MONSTER: Monashスケーラブル時系列評価リポジトリ
MONSTER: Monash Scalable Time Series Evaluation Repository
February 21, 2025
著者: Angus Dempster, Navid Mohammadi Foumani, Chang Wei Tan, Lynn Miller, Amish Mishra, Mahsa Salehi, Charlotte Pelletier, Daniel F. Schmidt, Geoffrey I. Webb
cs.AI
要旨
我々はMONSTER(MONash Scalable Time Series Evaluation Repository)を紹介する。これは時系列分類のための大規模データセットのコレクションである。時系列分類の分野は、UCRおよびUEA時系列分類リポジトリによって設定された共通ベンチマークの恩恵を受けてきた。しかし、これらのベンチマークに含まれるデータセットは小さく、それぞれ中央値が217および255の事例数である。その結果、これらのベンチマークは、多様な小規模データセットにおいて低い分類誤差を達成するために最適化された、分散を最小化するモデルに偏っており、スケーラビリティなどの計算上の問題にはほとんど重きを置いていない。我々は、より大規模なデータセットを使用したベンチマークを導入することで、この分野を多様化することを目指している。より大量のデータから効果的に学習するという理論的および実践的な課題に取り組むことで、この分野における新たな進展の可能性が大きく広がると信じている。
English
We introduce MONSTER-the MONash Scalable Time Series Evaluation Repository-a
collection of large datasets for time series classification. The field of time
series classification has benefitted from common benchmarks set by the UCR and
UEA time series classification repositories. However, the datasets in these
benchmarks are small, with median sizes of 217 and 255 examples, respectively.
In consequence they favour a narrow subspace of models that are optimised to
achieve low classification error on a wide variety of smaller datasets, that
is, models that minimise variance, and give little weight to computational
issues such as scalability. Our hope is to diversify the field by introducing
benchmarks using larger datasets. We believe that there is enormous potential
for new progress in the field by engaging with the theoretical and practical
challenges of learning effectively from larger quantities of data.Summary
AI-Generated Summary