Exploitation des modèles de vision pour l'analyse de séries temporelles : une étude
Harnessing Vision Models for Time Series Analysis: A Survey
February 13, 2025
Auteurs: Jingchao Ni, Ziming Zhao, ChengAo Shen, Hanghang Tong, Dongjin Song, Wei Cheng, Dongsheng Luo, Haifeng Chen
cs.AI
Résumé
L'analyse des séries temporelles a connu un développement inspirant, passant des modèles autorégressifs traditionnels aux modèles d'apprentissage profond, puis aux récents Transformers et aux grands modèles de langage (LLMs). Des efforts ont également été déployés pour exploiter les modèles de vision dans l'analyse des séries temporelles, mais ils sont restés moins visibles pour la communauté en raison de la prédominance des recherches sur la modélisation des séquences dans ce domaine. Cependant, l'écart entre les séries temporelles continues et l'espace discret des tokens des LLMs, ainsi que les défis liés à la modélisation explicite des corrélations entre les variables dans les séries temporelles multivariées, ont redirigé une partie de l'attention de la recherche vers les modèles de vision de grande envergure (LVMs) et les modèles de vision et langage (VLMs), tout aussi performants. Pour combler le vide dans la littérature existante, cette étude explore les avantages des modèles de vision par rapport aux LLMs dans l'analyse des séries temporelles. Elle propose un aperçu complet et approfondi des méthodes existantes, avec une double perspective de taxonomie détaillée qui répond aux questions de recherche clés, notamment comment encoder les séries temporelles sous forme d'images et comment modéliser ces séries temporelles imagées pour diverses tâches. De plus, nous abordons les défis liés aux étapes de pré- et post-traitement impliquées dans ce cadre et esquissons des directions futures pour faire progresser davantage l'analyse des séries temporelles avec les modèles de vision.
English
Time series analysis has witnessed the inspiring development from traditional
autoregressive models, deep learning models, to recent Transformers and Large
Language Models (LLMs). Efforts in leveraging vision models for time series
analysis have also been made along the way but are less visible to the
community due to the predominant research on sequence modeling in this domain.
However, the discrepancy between continuous time series and the discrete token
space of LLMs, and the challenges in explicitly modeling the correlations of
variates in multivariate time series have shifted some research attentions to
the equally successful Large Vision Models (LVMs) and Vision Language Models
(VLMs). To fill the blank in the existing literature, this survey discusses the
advantages of vision models over LLMs in time series analysis. It provides a
comprehensive and in-depth overview of the existing methods, with dual views of
detailed taxonomy that answer the key research questions including how to
encode time series as images and how to model the imaged time series for
various tasks. Additionally, we address the challenges in the pre- and
post-processing steps involved in this framework and outline future directions
to further advance time series analysis with vision models.Summary
AI-Generated Summary