TimeSeriesScientist : Un agent d'IA polyvalent pour l'analyse de séries temporelles
TimeSeriesScientist: A General-Purpose AI Agent for Time Series Analysis
October 2, 2025
papers.authors: Haokun Zhao, Xiang Zhang, Jiaqi Wei, Yiwei Xu, Yuting He, Siqi Sun, Chenyu You
cs.AI
papers.abstract
La prévision de séries temporelles est essentielle pour la prise de décision dans des domaines aussi variés que l'énergie, la finance, le climat et la santé publique. En pratique, les prévisionnistes sont confrontés à des milliers de séries courtes et bruyantes, variant en fréquence, qualité et horizon, où le coût dominant ne réside pas dans l'ajustement des modèles, mais dans le prétraitement, la validation et l'assemblage laborieux nécessaires pour obtenir des prédictions fiables. Les modèles statistiques et d'apprentissage profond dominants sont adaptés à des ensembles de données ou domaines spécifiques et généralisent mal. Un cadre général, indépendant du domaine, minimisant l'intervention humaine, est donc urgent. Dans cet article, nous présentons TimeSeriesScientist (TSci), le premier cadre agentique piloté par un LLM pour la prévision générale de séries temporelles. Ce cadre comprend quatre agents spécialisés : Curator effectue des diagnostics guidés par LLM, enrichis par des outils externes qui raisonnent sur les statistiques des données pour choisir un prétraitement ciblé ; Planner réduit l'espace des hypothèses de choix de modèle en exploitant des diagnostics multi-modaux et une auto-planification sur les entrées ; Forecaster réalise l'ajustement et la validation des modèles et, sur la base des résultats, sélectionne de manière adaptative la meilleure configuration de modèle ainsi que la stratégie d'assemblage pour produire les prédictions finales ; et Reporter synthétise l'ensemble du processus dans un rapport complet et transparent. Avec des justifications en langage naturel transparentes et des rapports détaillés, TSci transforme le flux de travail de prévision en un système boîte blanche, à la fois interprétable et extensible à travers les tâches. Les résultats empiriques sur huit benchmarks établis démontrent que TSci surpasse systématiquement les bases de référence statistiques et basées sur LLM, réduisant l'erreur de prévision de 10,4 % et 38,2 % en moyenne, respectivement. De plus, TSci produit un rapport clair et rigoureux qui rend le flux de travail de prévision plus transparent et interprétable.
English
Time series forecasting is central to decision-making in domains as diverse
as energy, finance, climate, and public health. In practice, forecasters face
thousands of short, noisy series that vary in frequency, quality, and horizon,
where the dominant cost lies not in model fitting, but in the labor-intensive
preprocessing, validation, and ensembling required to obtain reliable
predictions. Prevailing statistical and deep learning models are tailored to
specific datasets or domains and generalize poorly. A general, domain-agnostic
framework that minimizes human intervention is urgently in demand. In this
paper, we introduce TimeSeriesScientist (TSci), the first LLM-driven agentic
framework for general time series forecasting. The framework comprises four
specialized agents: Curator performs LLM-guided diagnostics augmented by
external tools that reason over data statistics to choose targeted
preprocessing; Planner narrows the hypothesis space of model choice by
leveraging multi-modal diagnostics and self-planning over the input; Forecaster
performs model fitting and validation and, based on the results, adaptively
selects the best model configuration as well as ensemble strategy to make final
predictions; and Reporter synthesizes the whole process into a comprehensive,
transparent report. With transparent natural-language rationales and
comprehensive reports, TSci transforms the forecasting workflow into a
white-box system that is both interpretable and extensible across tasks.
Empirical results on eight established benchmarks demonstrate that TSci
consistently outperforms both statistical and LLM-based baselines, reducing
forecast error by an average of 10.4% and 38.2%, respectively. Moreover, TSci
produces a clear and rigorous report that makes the forecasting workflow more
transparent and interpretable.