LLaTiSA: Auf dem Weg zu schwierigkeitsgeschichteter Zeitreihenanalyse – von der visuellen Wahrnehmung zur Semantik
LLaTiSA: Towards Difficulty-Stratified Time Series Reasoning from Visual Perception to Semantics
April 19, 2026
Autoren: Yueyang Ding, HaoPeng Zhang, Rui Dai, Yi Wang, Tianyu Zong, Kaikui Liu, Xiangxiang Chu
cs.AI
Zusammenfassung
Ein umfassendes Verständnis von Zeitreihen bleibt eine große Herausforderung für große Sprachmodelle (LLMs). Die aktuelle Forschung wird durch fragmentierte Aufgabendefinitionen und Benchmarks mit inhärenten Unschärfen behindert, was eine rigorose Bewertung und die Entwicklung einheitlicher Zeitreihen-Reasoning-Modelle (TSRMs) verhindert. Um diese Lücke zu schließen, formalisieren wir Zeitreihen-Reasoning (TSR) durch eine vierstufige Taxonomie mit zunehmender kognitiver Komplexität. Wir stellen HiTSR vor, einen hierarchischen Zeitreihen-Reasoning-Datensatz, der 83.000 Beispiele mit diversen Aufgabenkombinationen und verifizierten Chain-of-Thought (CoT)-Verläufen umfasst. Unter Nutzung von HiTSR schlagen wir LLaTiSA vor, ein leistungsstarkes TSRM, das visualisierte Muster mit präzisionskalibrierten numerischen Tabellen integriert, um das zeitliche Wahrnehmungsvermögen von visuell-sprachlichen Modellen (VLMs) zu verbessern. Durch eine mehrstufige Curriculum-Fine-Tuning-Strategie erzielt LLaTiSA eine überlegene Leistung und zeigt eine robuste Out-of-Distribution-Generalisation über verschiedene TSR-Aufgaben und reale Szenarien hinweg. Unser Code ist verfügbar unter https://github.com/RainingNovember/LLaTiSA.
English
Comprehensive understanding of time series remains a significant challenge for Large Language Models (LLMs). Current research is hindered by fragmented task definitions and benchmarks with inherent ambiguities, precluding rigorous evaluation and the development of unified Time Series Reasoning Models(TSRMs). To bridge this gap, we formalize Time Series Reasoning (TSR) via a four-level taxonomy of increasing cognitive complexity. We introduce HiTSR, a hierarchical time series reasoning dataset comprising 83k samples with diverse task combinations and verified Chain-of-Thought (CoT) trajectories. Leveraging HiTSR, we propose LLaTiSA, a strong TSRM that integrates visualized patterns with precision-calibrated numerical tables to enhance the temporal perception of Vision-Language Models (VLMs). Through a multi-stage curriculum fine-tuning strategy, LLaTiSA achieves superior performance and exhibits robust out-of-distribution generalization across diverse TSR tasks and real-world scenarios. Our code is available at https://github.com/RainingNovember/LLaTiSA.