LLaTiSA: Rumo ao Raciocínio sobre Séries Temporais Estratificadas por Dificuldade, da Percepção Visual à Semântica

Resumo

A compreensão abrangente de séries temporais permanece um desafio significativo para os Grandes Modelos de Linguagem (LLMs). A pesquisa atual é dificultada por definições de tarefas fragmentadas e benchmarks com ambiguidades inerentes, impedindo uma avaliação rigorosa e o desenvolvimento de Modelos de Raciocínio de Séries Temporais (TSRMs) unificados. Para preencher esta lacuna, formalizamos o Raciocínio de Séries Temporais (TSR) por meio de uma taxonomia de quatro níveis de complexidade cognitiva crescente. Apresentamos o HiTSR, um conjunto de dados hierárquico de raciocínio de séries temporais composto por 83 mil amostras com diversas combinações de tarefas e trajetórias de Cadeia de Pensamento (CoT) verificadas. Utilizando o HiTSR, propomos o LLaTiSA, um TSRM robusto que integra padrões visualizados com tabelas numéricas de precisão calibrada para aprimorar a percepção temporal de Modelos de Linguagem Visual (VLMs). Por meio de uma estratégia de fine-tuning curricular multiestágio, o LLaTiSA alcança desempenho superior e exibe generalização robusta fora da distribuição em diversas tarefas de TSR e cenários do mundo real. Nosso código está disponível em https://github.com/RainingNovember/LLaTiSA.

English

Comprehensive understanding of time series remains a significant challenge for Large Language Models (LLMs). Current research is hindered by fragmented task definitions and benchmarks with inherent ambiguities, precluding rigorous evaluation and the development of unified Time Series Reasoning Models(TSRMs). To bridge this gap, we formalize Time Series Reasoning (TSR) via a four-level taxonomy of increasing cognitive complexity. We introduce HiTSR, a hierarchical time series reasoning dataset comprising 83k samples with diverse task combinations and verified Chain-of-Thought (CoT) trajectories. Leveraging HiTSR, we propose LLaTiSA, a strong TSRM that integrates visualized patterns with precision-calibrated numerical tables to enhance the temporal perception of Vision-Language Models (VLMs). Through a multi-stage curriculum fine-tuning strategy, LLaTiSA achieves superior performance and exhibits robust out-of-distribution generalization across diverse TSR tasks and real-world scenarios. Our code is available at https://github.com/RainingNovember/LLaTiSA.

LLaTiSA: Rumo ao Raciocínio sobre Séries Temporais Estratificadas por Dificuldade, da Percepção Visual à Semântica

LLaTiSA: Towards Difficulty-Stratified Time Series Reasoning from Visual Perception to Semantics

Resumo

Support