MONSTER: Monash Skalierbares Zeitreihen-Evaluierungs-Repository
MONSTER: Monash Scalable Time Series Evaluation Repository
February 21, 2025
Autoren: Angus Dempster, Navid Mohammadi Foumani, Chang Wei Tan, Lynn Miller, Amish Mishra, Mahsa Salehi, Charlotte Pelletier, Daniel F. Schmidt, Geoffrey I. Webb
cs.AI
Zusammenfassung
Wir stellen MONSTER vor - das MONash Scalable Time Series Evaluation Repository - eine Sammlung großer Datensätze für die Klassifizierung von Zeitreihen. Das Gebiet der Zeitreihenklassifizierung hat von den gemeinsamen Benchmarks profitiert, die von den Zeitreihenklassifizierungs-Repositories UCR und UEA festgelegt wurden. Die Datensätze in diesen Benchmarks sind jedoch klein, mit Median-Größen von jeweils 217 und 255 Beispielen. Folglich bevorzugen sie einen engen Modellunterraum, der darauf optimiert ist, eine geringe Klassifizierungsfehlerquote auf einer Vielzahl kleinerer Datensätze zu erreichen, d.h. Modelle, die die Varianz minimieren, und wenig Gewicht auf Skalierbarkeitsprobleme legen. Unser Ziel ist es, das Gebiet durch die Einführung von Benchmarks mit größeren Datensätzen zu diversifizieren. Wir glauben, dass es ein enormes Potenzial für neue Fortschritte in diesem Bereich gibt, indem wir uns mit den theoretischen und praktischen Herausforderungen des effektiven Lernens aus größeren Datenmengen auseinandersetzen.
English
We introduce MONSTER-the MONash Scalable Time Series Evaluation Repository-a
collection of large datasets for time series classification. The field of time
series classification has benefitted from common benchmarks set by the UCR and
UEA time series classification repositories. However, the datasets in these
benchmarks are small, with median sizes of 217 and 255 examples, respectively.
In consequence they favour a narrow subspace of models that are optimised to
achieve low classification error on a wide variety of smaller datasets, that
is, models that minimise variance, and give little weight to computational
issues such as scalability. Our hope is to diversify the field by introducing
benchmarks using larger datasets. We believe that there is enormous potential
for new progress in the field by engaging with the theoretical and practical
challenges of learning effectively from larger quantities of data.Summary
AI-Generated Summary