Aprovechamiento de Modelos de Visión para el Análisis de Series Temporales: Una Revisión
Harnessing Vision Models for Time Series Analysis: A Survey
February 13, 2025
Autores: Jingchao Ni, Ziming Zhao, ChengAo Shen, Hanghang Tong, Dongjin Song, Wei Cheng, Dongsheng Luo, Haifeng Chen
cs.AI
Resumen
El análisis de series temporales ha sido testigo de un desarrollo inspirador, desde los modelos autorregresivos tradicionales y los modelos de aprendizaje profundo, hasta los recientes Transformers y los Modelos de Lenguaje de Gran Escala (LLMs, por sus siglas en inglés). A lo largo del camino, también se han realizado esfuerzos para aprovechar modelos de visión en el análisis de series temporales, aunque han sido menos visibles para la comunidad debido a la predominante investigación en modelado de secuencias en este dominio. Sin embargo, la discrepancia entre las series temporales continuas y el espacio discreto de tokens de los LLMs, junto con los desafíos en el modelado explícito de las correlaciones entre variables en series temporales multivariadas, han desviado parte de la atención investigativa hacia los igualmente exitosos Modelos de Visión de Gran Escala (LVMs) y los Modelos de Visión y Lenguaje (VLMs). Para llenar el vacío en la literatura existente, este estudio discute las ventajas de los modelos de visión sobre los LLMs en el análisis de series temporales. Proporciona una visión general exhaustiva y detallada de los métodos existentes, con una doble perspectiva de taxonomía que responde a preguntas clave de investigación, como cómo codificar series temporales como imágenes y cómo modelar las series temporales convertidas en imágenes para diversas tareas. Además, abordamos los desafíos en los pasos de pre y post-procesamiento involucrados en este marco y esbozamos direcciones futuras para avanzar aún más en el análisis de series temporales con modelos de visión.
English
Time series analysis has witnessed the inspiring development from traditional
autoregressive models, deep learning models, to recent Transformers and Large
Language Models (LLMs). Efforts in leveraging vision models for time series
analysis have also been made along the way but are less visible to the
community due to the predominant research on sequence modeling in this domain.
However, the discrepancy between continuous time series and the discrete token
space of LLMs, and the challenges in explicitly modeling the correlations of
variates in multivariate time series have shifted some research attentions to
the equally successful Large Vision Models (LVMs) and Vision Language Models
(VLMs). To fill the blank in the existing literature, this survey discusses the
advantages of vision models over LLMs in time series analysis. It provides a
comprehensive and in-depth overview of the existing methods, with dual views of
detailed taxonomy that answer the key research questions including how to
encode time series as images and how to model the imaged time series for
various tasks. Additionally, we address the challenges in the pre- and
post-processing steps involved in this framework and outline future directions
to further advance time series analysis with vision models.Summary
AI-Generated Summary