ChatPaper.aiChatPaper

MONSTER: 모나쉬 확장 가능 시계열 평가 리포지토리

MONSTER: Monash Scalable Time Series Evaluation Repository

February 21, 2025
저자: Angus Dempster, Navid Mohammadi Foumani, Chang Wei Tan, Lynn Miller, Amish Mishra, Mahsa Salehi, Charlotte Pelletier, Daniel F. Schmidt, Geoffrey I. Webb
cs.AI

초록

우리는 MONSTER(MONash Scalable Time Series Evaluation Repository)를 소개합니다. 이는 시계열 분류를 위한 대규모 데이터셋 컬렉션입니다. 시계열 분류 분야는 UCR 및 UEA 시계열 분류 리포지토리에서 설정한 공통 벤치마크로부터 많은 혜택을 받아왔습니다. 그러나 이러한 벤치마크의 데이터셋은 크기가 작아, 각각 중간값이 217개와 255개의 예제로 구성되어 있습니다. 결과적으로 이들은 다양한 소규모 데이터셋에서 낮은 분류 오류를 달성하도록 최적화된 모델, 즉 분산을 최소화하고 확장성과 같은 계산적 문제를 거의 고려하지 않는 모델의 좁은 하위 공간을 선호합니다. 우리는 더 큰 데이터셋을 사용한 벤치마크를 도입함으로써 이 분야를 다양화하고자 합니다. 더 많은 양의 데이터로부터 효과적으로 학습하는 이론적, 실질적 도전 과제에 접근함으로써 이 분야에서 새로운 진전의 엄청난 잠재력이 있다고 믿습니다.
English
We introduce MONSTER-the MONash Scalable Time Series Evaluation Repository-a collection of large datasets for time series classification. The field of time series classification has benefitted from common benchmarks set by the UCR and UEA time series classification repositories. However, the datasets in these benchmarks are small, with median sizes of 217 and 255 examples, respectively. In consequence they favour a narrow subspace of models that are optimised to achieve low classification error on a wide variety of smaller datasets, that is, models that minimise variance, and give little weight to computational issues such as scalability. Our hope is to diversify the field by introducing benchmarks using larger datasets. We believe that there is enormous potential for new progress in the field by engaging with the theoretical and practical challenges of learning effectively from larger quantities of data.

Summary

AI-Generated Summary

PDF32February 25, 2025