Insight Miner: 자연어와의 교차 도메인 정렬을 위한 시계열 분석 데이터셋
Insight Miner: A Time Series Analysis Dataset for Cross-Domain Alignment with Natural Language
December 12, 2025
저자: Yunkai Zhang, Yawen Zhang, Ming Zheng, Kezhen Chen, Chongyang Gao, Ruian Ge, Siyuan Teng, Amine Jelloul, Jinmeng Rao, Xiaoyuan Guo, Chiang-Wei Fang, Zeyu Zheng, Jie Yang
cs.AI
초록
시계열 데이터는 환경 분석, 농업, 교통, 금융 등 다양한 과학 및 산업 분야에서 핵심적인 역할을 합니다. 그러나 이러한 데이터에서 통찰력을 추출하는 작업은 일반적으로 깊은 영역 전문 지식을 요구하며, 시간과 노동이 많이 소요되는 과정입니다. 본 논문에서는 영역 특화 지식이 풍부하게 반영된 고품질의 포괄적인 시계열 설명을 생성하도록 설계된 대규모 다중모달 모델(LMM)인 Insight Miner를 제안합니다. 이를 위해 시계열과 언어 정렬을 위한 최초의 일반 영역 데이터셋인 TS-Insights\href{https://huggingface.co/datasets/zhykoties/time-series-language-alignment{https://huggingface.co/datasets/zhykoties/time-series-language-alignment}.}를 도입했습니다. TS-Insights는 20개의 예측 데이터셋에서 추출한 10만 개의 시계열 창으로 구성되어 있습니다. 우리는 통계 도구를 사용해 원시 시계열에서 특징을 추출한 후 GPT-4를 활용하여 이를 일관된 추세 설명으로 합성하는 새로운 에이전트 기반 워크플로우를 통해 이 데이터셋을 구축했습니다. TS-Insights로 지시 튜닝을 수행한 후, Insight Miner는 시계열 설명 및 통찰력 생성 작업에서 LLaVA liu2023llava 및 GPT-4와 같은 최첨단 다중모달 모델들을 능가하는 성능을 보였습니다. 우리의 연구 결과는 시계열 분석에 LMM을 활용하는 유망한 방향을 제시하며, LLM이 시계열을 기본 입력 양식으로 해석할 수 있는 기반을 마련하는 중요한 단계가 될 것입니다.
English
Time-series data is critical across many scientific and industrial domains, including environmental analysis, agriculture, transportation, and finance. However, mining insights from this data typically requires deep domain expertise, a process that is both time-consuming and labor-intensive. In this paper, we propose Insight Miner, a large-scale multimodal model (LMM) designed to generate high-quality, comprehensive time-series descriptions enriched with domain-specific knowledge. To facilitate this, we introduce TS-InsightsAvailable at \href{https://huggingface.co/datasets/zhykoties/time-series-language-alignment{https://huggingface.co/datasets/zhykoties/time-series-language-alignment}.}, the first general-domain dataset for time series and language alignment. TS-Insights contains 100k time-series windows sampled from 20 forecasting datasets. We construct this dataset using a novel agentic workflow, where we use statistical tools to extract features from raw time series before synthesizing them into coherent trend descriptions with GPT-4. Following instruction tuning on TS-Insights, Insight Miner outperforms state-of-the-art multimodal models, such as LLaVA liu2023llava and GPT-4, in generating time-series descriptions and insights. Our findings suggest a promising direction for leveraging LMMs in time series analysis, and serve as a foundational step toward enabling LLMs to interpret time series as a native input modality.