Insight Miner: Um Conjunto de Dados para Análise de Séries Temporais com Alinhamento Transdomínio em Linguagem Natural
Insight Miner: A Time Series Analysis Dataset for Cross-Domain Alignment with Natural Language
December 12, 2025
Autores: Yunkai Zhang, Yawen Zhang, Ming Zheng, Kezhen Chen, Chongyang Gao, Ruian Ge, Siyuan Teng, Amine Jelloul, Jinmeng Rao, Xiaoyuan Guo, Chiang-Wei Fang, Zeyu Zheng, Jie Yang
cs.AI
Resumo
Os dados de séries temporais são críticos em diversos domínios científicos e industriais, incluindo análise ambiental, agricultura, transporte e finanças. No entanto, a extração de insights desses dados normalmente requer profunda expertise de domínio, um processo que é tanto demorado quanto intensivo em mão de obra. Neste artigo, propomos o Insight Miner, um modelo multimodal de larga escala (LMM) projetado para gerar descrições de séries temporais de alta qualidade e abrangentes, enriquecidas com conhecimento específico do domínio. Para viabilizar isso, introduzimos o TS-Insights (disponível em \href{https://huggingface.co/datasets/zhykoties/time-series-language-alignment}{https://huggingface.co/datasets/zhykoties/time-series-language-alignment}), o primeiro conjunto de dados de domínio geral para alinhamento de séries temporais e linguagem. O TS-Insights contém 100k janelas de séries temporais amostradas a partir de 20 conjuntos de dados de previsão. Construímos este conjunto de dados usando um novo fluxo de trabalho agentivo, no qual utilizamos ferramentas estatísticas para extrair características das séries temporais brutas antes de sintetizá-las em descrições de tendências coerentes com o GPT-4. Após o ajuste por instrução no TS-Insights, o Insight Miner supera modelos multimodais de última geração, como LLaVA liu2023llava e GPT-4, na geração de descrições e insights de séries temporais. Nossos achados sugerem uma direção promissora para o aproveitamento de LMMs na análise de séries temporais e representam um passo fundamental para capacitar LLMs a interpretar séries temporais como uma modalidade de entrada nativa.
English
Time-series data is critical across many scientific and industrial domains, including environmental analysis, agriculture, transportation, and finance. However, mining insights from this data typically requires deep domain expertise, a process that is both time-consuming and labor-intensive. In this paper, we propose Insight Miner, a large-scale multimodal model (LMM) designed to generate high-quality, comprehensive time-series descriptions enriched with domain-specific knowledge. To facilitate this, we introduce TS-InsightsAvailable at \href{https://huggingface.co/datasets/zhykoties/time-series-language-alignment{https://huggingface.co/datasets/zhykoties/time-series-language-alignment}.}, the first general-domain dataset for time series and language alignment. TS-Insights contains 100k time-series windows sampled from 20 forecasting datasets. We construct this dataset using a novel agentic workflow, where we use statistical tools to extract features from raw time series before synthesizing them into coherent trend descriptions with GPT-4. Following instruction tuning on TS-Insights, Insight Miner outperforms state-of-the-art multimodal models, such as LLaVA liu2023llava and GPT-4, in generating time-series descriptions and insights. Our findings suggest a promising direction for leveraging LMMs in time series analysis, and serve as a foundational step toward enabling LLMs to interpret time series as a native input modality.