ChatPaper.aiChatPaper

Insight Miner: набор данных для анализа временных рядов для межпредметного согласования с естественным языком

Insight Miner: A Time Series Analysis Dataset for Cross-Domain Alignment with Natural Language

December 12, 2025
Авторы: Yunkai Zhang, Yawen Zhang, Ming Zheng, Kezhen Chen, Chongyang Gao, Ruian Ge, Siyuan Teng, Amine Jelloul, Jinmeng Rao, Xiaoyuan Guo, Chiang-Wei Fang, Zeyu Zheng, Jie Yang
cs.AI

Аннотация

Временные ряды играют ключевую роль во многих научных и промышленных областях, включая экологический анализ, сельское хозяйство, транспорт и финансы. Однако извлечение инсайтов из таких данных традиционно требует глубоких предметных знаний — процесса, который является одновременно трудоемким и затратным по времени. В данной статье мы представляем Insight Miner — крупномасштабную мультимодальную модель (LMM), предназначенную для генерации качественных и всесторонних описаний временных рядов, обогащенных предметной экспертизой. Для решения этой задачи мы представляем TS-Insights (доступен по ссылке: \href{https://huggingface.co/datasets/zhykoties/time-series-language-alignment}{https://huggingface.co/datasets/zhykoties/time-series-language-alignment}), первую общедоменную базу данных для согласования временных рядов и естественного языка. TS-Insights содержит 100 тыс. временных окон, выбранных из 20 наборов данных для прогнозирования. Мы создали этот набор данных с помощью нового агентного workflow, в котором используем статистические инструменты для извлечения признаков из исходных временных рядов, а затем синтезируем их в связные описания трендов с помощью GPT-4. После инструктивного тонкого настроя на TS-Insights модель Insight Miner превосходит современные мультимодальные модели, такие как LLaVA (liu2023llava) и GPT-4, в генерации описаний и инсайтов по временным рядам. Наши результаты указывают на перспективное направление использования LMM в анализе временных рядов и служат основой для того, чтобы большие языковые модели могли интерпретировать временные ряды как естественный тип входных данных.
English
Time-series data is critical across many scientific and industrial domains, including environmental analysis, agriculture, transportation, and finance. However, mining insights from this data typically requires deep domain expertise, a process that is both time-consuming and labor-intensive. In this paper, we propose Insight Miner, a large-scale multimodal model (LMM) designed to generate high-quality, comprehensive time-series descriptions enriched with domain-specific knowledge. To facilitate this, we introduce TS-InsightsAvailable at \href{https://huggingface.co/datasets/zhykoties/time-series-language-alignment{https://huggingface.co/datasets/zhykoties/time-series-language-alignment}.}, the first general-domain dataset for time series and language alignment. TS-Insights contains 100k time-series windows sampled from 20 forecasting datasets. We construct this dataset using a novel agentic workflow, where we use statistical tools to extract features from raw time series before synthesizing them into coherent trend descriptions with GPT-4. Following instruction tuning on TS-Insights, Insight Miner outperforms state-of-the-art multimodal models, such as LLaVA liu2023llava and GPT-4, in generating time-series descriptions and insights. Our findings suggest a promising direction for leveraging LMMs in time series analysis, and serve as a foundational step toward enabling LLMs to interpret time series as a native input modality.
PDF42December 20, 2025