Sfruttare i Modelli di Visione per l'Analisi delle Serie Temporali: Una Rassegna
Harnessing Vision Models for Time Series Analysis: A Survey
February 13, 2025
Autori: Jingchao Ni, Ziming Zhao, ChengAo Shen, Hanghang Tong, Dongjin Song, Wei Cheng, Dongsheng Luo, Haifeng Chen
cs.AI
Abstract
L'analisi delle serie temporali ha assistito a uno sviluppo stimolante, passando dai tradizionali modelli autoregressivi ai modelli di deep learning, fino ai recenti Transformer e ai Large Language Models (LLM). Nel frattempo, sono stati compiuti sforzi per sfruttare i modelli di visione nell'analisi delle serie temporali, ma questi sono rimasti meno visibili alla comunità a causa della predominante ricerca sulla modellazione di sequenze in questo ambito. Tuttavia, la discrepanza tra le serie temporali continue e lo spazio discreto dei token degli LLM, insieme alle sfide nel modellare esplicitamente le correlazioni tra le variabili nelle serie temporali multivariate, hanno spostato parte dell'attenzione della ricerca verso i parimenti efficaci Large Vision Models (LVM) e Vision Language Models (VLM). Per colmare questa lacuna nella letteratura esistente, questa rassegna discute i vantaggi dei modelli di visione rispetto agli LLM nell'analisi delle serie temporali. Offre una panoramica completa e approfondita dei metodi esistenti, con una doppia prospettiva di tassonomia dettagliata che risponde alle principali domande di ricerca, tra cui come codificare le serie temporali come immagini e come modellare le serie temporali trasformate in immagini per vari compiti. Inoltre, affrontiamo le sfide nei passaggi di pre- e post-elaborazione coinvolti in questo framework e delineiamo direzioni future per far progredire ulteriormente l'analisi delle serie temporali con i modelli di visione.
English
Time series analysis has witnessed the inspiring development from traditional
autoregressive models, deep learning models, to recent Transformers and Large
Language Models (LLMs). Efforts in leveraging vision models for time series
analysis have also been made along the way but are less visible to the
community due to the predominant research on sequence modeling in this domain.
However, the discrepancy between continuous time series and the discrete token
space of LLMs, and the challenges in explicitly modeling the correlations of
variates in multivariate time series have shifted some research attentions to
the equally successful Large Vision Models (LVMs) and Vision Language Models
(VLMs). To fill the blank in the existing literature, this survey discusses the
advantages of vision models over LLMs in time series analysis. It provides a
comprehensive and in-depth overview of the existing methods, with dual views of
detailed taxonomy that answer the key research questions including how to
encode time series as images and how to model the imaged time series for
various tasks. Additionally, we address the challenges in the pre- and
post-processing steps involved in this framework and outline future directions
to further advance time series analysis with vision models.