TimeSeriesScientist: 時系列分析のための汎用AIエージェント
TimeSeriesScientist: A General-Purpose AI Agent for Time Series Analysis
October 2, 2025
著者: Haokun Zhao, Xiang Zhang, Jiaqi Wei, Yiwei Xu, Yuting He, Siqi Sun, Chenyu You
cs.AI
要旨
時系列予測は、エネルギー、金融、気候、公衆衛生など多岐にわたる分野における意思決定の中心をなす。実際には、予測者は頻度、品質、予測期間が異なる数千の短くノイズの多い時系列に直面し、その主なコストはモデルの適合ではなく、信頼性の高い予測を得るために必要な労働集約的な前処理、検証、アンサンブルにある。主流の統計モデルや深層学習モデルは特定のデータセットや分野に特化しており、汎化性能が低い。人間の介入を最小限に抑えた汎用的でドメインに依存しないフレームワークが緊急に求められている。本論文では、汎用的な時系列予測のための初のLLM駆動型エージェントフレームワークであるTimeSeriesScientist(TSci)を紹介する。このフレームワークは4つの専門エージェントで構成される:Curatorは、データ統計を推論する外部ツールを活用したLLMガイドの診断を行い、ターゲットを絞った前処理を選択する;Plannerは、マルチモーダル診断と入力に対する自己計画を活用してモデル選択の仮説空間を狭める;Forecasterはモデルの適合と検証を行い、その結果に基づいて最適なモデル構成とアンサンブル戦略を適応的に選択して最終的な予測を行う;Reporterはプロセス全体を包括的で透明性の高いレポートにまとめる。透明性のある自然言語による根拠と包括的なレポートにより、TSciは予測ワークフローを解釈可能でタスク間で拡張可能なホワイトボックスシステムに変える。8つの確立されたベンチマークでの実証結果は、TSciが統計モデルとLLMベースのベースラインを一貫して上回り、予測誤差をそれぞれ平均10.4%と38.2%削減することを示している。さらに、TSciは予測ワークフローをより透明で解釈可能にする明確かつ厳密なレポートを生成する。
English
Time series forecasting is central to decision-making in domains as diverse
as energy, finance, climate, and public health. In practice, forecasters face
thousands of short, noisy series that vary in frequency, quality, and horizon,
where the dominant cost lies not in model fitting, but in the labor-intensive
preprocessing, validation, and ensembling required to obtain reliable
predictions. Prevailing statistical and deep learning models are tailored to
specific datasets or domains and generalize poorly. A general, domain-agnostic
framework that minimizes human intervention is urgently in demand. In this
paper, we introduce TimeSeriesScientist (TSci), the first LLM-driven agentic
framework for general time series forecasting. The framework comprises four
specialized agents: Curator performs LLM-guided diagnostics augmented by
external tools that reason over data statistics to choose targeted
preprocessing; Planner narrows the hypothesis space of model choice by
leveraging multi-modal diagnostics and self-planning over the input; Forecaster
performs model fitting and validation and, based on the results, adaptively
selects the best model configuration as well as ensemble strategy to make final
predictions; and Reporter synthesizes the whole process into a comprehensive,
transparent report. With transparent natural-language rationales and
comprehensive reports, TSci transforms the forecasting workflow into a
white-box system that is both interpretable and extensible across tasks.
Empirical results on eight established benchmarks demonstrate that TSci
consistently outperforms both statistical and LLM-based baselines, reducing
forecast error by an average of 10.4% and 38.2%, respectively. Moreover, TSci
produces a clear and rigorous report that makes the forecasting workflow more
transparent and interpretable.