ChatPaper.aiChatPaper

Insight Miner: un dataset per l'analisi delle serie temporali per l'allineamento cross-dominio con il linguaggio naturale

Insight Miner: A Time Series Analysis Dataset for Cross-Domain Alignment with Natural Language

December 12, 2025
Autori: Yunkai Zhang, Yawen Zhang, Ming Zheng, Kezhen Chen, Chongyang Gao, Ruian Ge, Siyuan Teng, Amine Jelloul, Jinmeng Rao, Xiaoyuan Guo, Chiang-Wei Fang, Zeyu Zheng, Jie Yang
cs.AI

Abstract

I dati temporali sono fondamentali in molti ambiti scientifici e industriali, tra cui l'analisi ambientale, l'agricoltura, i trasporti e la finanza. Tuttavia, l'estrazione di informazioni da questi dati richiede tipicamente una profonda competenza di dominio, un processo che risulta sia dispendioso in termini di tempo che laborioso. In questo articolo, proponiamo Insight Miner, un modello multimodale su larga scala (LMM) progettato per generare descrizioni temporali di alta qualità e complete, arricchite con conoscenze specifiche del dominio. A tal fine, introduciamo TS-Insights (disponibile all'indirizzo \href{https://huggingface.co/datasets/zhykoties/time-series-language-alignment}{https://huggingface.co/datasets/zhykoties/time-series-language-alignment}), il primo dataset di dominio generale per l'allineamento tra serie temporali e linguaggio. TS-Insights contiene 100k finestre temporali campionate da 20 dataset di forecasting. Abbiamo costruito questo dataset utilizzando un innovativo flusso di lavoro agentico, in cui strumenti statistici estraggono caratteristiche dalle serie temporali grezze prima di sintetizzarle in descrizioni coerenti dell'andamento tramite GPT-4. Dopo l'instruction tuning su TS-Insights, Insight Miner supera modelli multimodali all'avanguardia, come LLaVA (liu2023llava) e GPT-4, nella generazione di descrizioni e approfondimenti sulle serie temporali. I nostri risultati indicano una direzione promettente per l'utilizzo degli LMM nell'analisi delle serie temporali e rappresentano un passo fondamentale verso l'abilitazione degli LLM a interpretare le serie temporali come una modalità di input nativa.
English
Time-series data is critical across many scientific and industrial domains, including environmental analysis, agriculture, transportation, and finance. However, mining insights from this data typically requires deep domain expertise, a process that is both time-consuming and labor-intensive. In this paper, we propose Insight Miner, a large-scale multimodal model (LMM) designed to generate high-quality, comprehensive time-series descriptions enriched with domain-specific knowledge. To facilitate this, we introduce TS-InsightsAvailable at \href{https://huggingface.co/datasets/zhykoties/time-series-language-alignment{https://huggingface.co/datasets/zhykoties/time-series-language-alignment}.}, the first general-domain dataset for time series and language alignment. TS-Insights contains 100k time-series windows sampled from 20 forecasting datasets. We construct this dataset using a novel agentic workflow, where we use statistical tools to extract features from raw time series before synthesizing them into coherent trend descriptions with GPT-4. Following instruction tuning on TS-Insights, Insight Miner outperforms state-of-the-art multimodal models, such as LLaVA liu2023llava and GPT-4, in generating time-series descriptions and insights. Our findings suggest a promising direction for leveraging LMMs in time series analysis, and serve as a foundational step toward enabling LLMs to interpret time series as a native input modality.
PDF42December 21, 2025