TimeSeriesScientist: 시계열 분석을 위한 범용 AI 에이전트
TimeSeriesScientist: A General-Purpose AI Agent for Time Series Analysis
October 2, 2025
저자: Haokun Zhao, Xiang Zhang, Jiaqi Wei, Yiwei Xu, Yuting He, Siqi Sun, Chenyu You
cs.AI
초록
시계열 예측은 에너지, 금융, 기후, 공중보건 등 다양한 분야에서 의사결정의 핵심 요소입니다. 실제로 예측자들은 빈도, 품질, 예측 기간이 다양한 수천 개의 짧고 노이즈가 많은 시계열 데이터를 다루며, 이때 주요 비용은 모델 적합이 아니라 신뢰할 수 있는 예측을 얻기 위해 필요한 노동 집약적인 전처리, 검증, 앙상블 과정에 있습니다. 기존의 통계 및 딥러닝 모델들은 특정 데이터셋이나 도메인에 맞춰져 있어 일반화가 잘 되지 않습니다. 따라서 인간의 개입을 최소화하는 일반적이고 도메인에 구애받지 않는 프레임워크가 시급히 요구되고 있습니다. 본 논문에서는 일반적인 시계열 예측을 위한 최초의 LLM 기반 에이전트 프레임워크인 TimeSeriesScientist(TSci)를 소개합니다. 이 프레임워크는 네 가지 전문 에이전트로 구성됩니다: Curator는 데이터 통계를 기반으로 한 외부 도구를 활용하여 LLM이 안내하는 진단을 수행하고, 이를 통해 목적에 맞는 전처리를 선택합니다; Planner는 다중 모드 진단과 입력에 대한 자기 계획을 통해 모델 선택의 가설 공간을 좁힙니다; Forecaster는 모델 적합과 검증을 수행하고, 그 결과를 바탕으로 최적의 모델 구성과 앙상블 전략을 적응적으로 선택하여 최종 예측을 생성합니다; 그리고 Reporter는 전체 과정을 종합적이고 투명한 보고서로 정리합니다. 투명한 자연어 설명과 포괄적인 보고서를 통해 TSci는 예측 워크플로를 해석 가능하고 작업 간 확장 가능한 화이트박스 시스템으로 변환합니다. 8개의 확립된 벤치마크에서의 실험 결과는 TSci가 통계 및 LLM 기반 베이스라인을 모두 일관되게 능가하며, 각각 평균 10.4%와 38.2%의 예측 오차를 감소시킴을 보여줍니다. 더욱이 TSci는 예측 워크플로를 더 투명하고 해석 가능하게 만드는 명확하고 엄격한 보고서를 생성합니다.
English
Time series forecasting is central to decision-making in domains as diverse
as energy, finance, climate, and public health. In practice, forecasters face
thousands of short, noisy series that vary in frequency, quality, and horizon,
where the dominant cost lies not in model fitting, but in the labor-intensive
preprocessing, validation, and ensembling required to obtain reliable
predictions. Prevailing statistical and deep learning models are tailored to
specific datasets or domains and generalize poorly. A general, domain-agnostic
framework that minimizes human intervention is urgently in demand. In this
paper, we introduce TimeSeriesScientist (TSci), the first LLM-driven agentic
framework for general time series forecasting. The framework comprises four
specialized agents: Curator performs LLM-guided diagnostics augmented by
external tools that reason over data statistics to choose targeted
preprocessing; Planner narrows the hypothesis space of model choice by
leveraging multi-modal diagnostics and self-planning over the input; Forecaster
performs model fitting and validation and, based on the results, adaptively
selects the best model configuration as well as ensemble strategy to make final
predictions; and Reporter synthesizes the whole process into a comprehensive,
transparent report. With transparent natural-language rationales and
comprehensive reports, TSci transforms the forecasting workflow into a
white-box system that is both interpretable and extensible across tasks.
Empirical results on eight established benchmarks demonstrate that TSci
consistently outperforms both statistical and LLM-based baselines, reducing
forecast error by an average of 10.4% and 38.2%, respectively. Moreover, TSci
produces a clear and rigorous report that makes the forecasting workflow more
transparent and interpretable.