TimeSeriesScientist: Un Agente AI Generico per l'Analisi delle Serie Temporali
TimeSeriesScientist: A General-Purpose AI Agent for Time Series Analysis
October 2, 2025
Autori: Haokun Zhao, Xiang Zhang, Jiaqi Wei, Yiwei Xu, Yuting He, Siqi Sun, Chenyu You
cs.AI
Abstract
La previsione di serie temporali è fondamentale per il processo decisionale in ambiti diversificati come l'energia, la finanza, il clima e la salute pubblica. Nella pratica, i previsori si trovano ad affrontare migliaia di serie brevi e rumorose che variano in frequenza, qualità e orizzonte temporale, dove il costo principale non risiede nell'adattamento del modello, ma nel preprocessamento, nella validazione e nell'ensembling laboriosi necessari per ottenere previsioni affidabili. I modelli statistici e di deep learning prevalenti sono adattati a specifici dataset o domini e generalizzano in modo insoddisfacente. È quindi urgente la necessità di un framework generale e agnostico rispetto al dominio che minimizzi l'intervento umano. In questo articolo, introduciamo TimeSeriesScientist (TSci), il primo framework agentico guidato da LLM per la previsione generale di serie temporali. Il framework comprende quattro agenti specializzati: Curator esegue diagnostiche guidate da LLM potenziate da strumenti esterni che ragionano sulle statistiche dei dati per scegliere un preprocessamento mirato; Planner riduce lo spazio delle ipotesi nella scelta del modello sfruttando diagnostiche multimodali e pianificazione autonoma sull'input; Forecaster esegue l'adattamento e la validazione del modello e, in base ai risultati, seleziona in modo adattivo la migliore configurazione del modello e la strategia di ensembling per produrre previsioni finali; e Reporter sintetizza l'intero processo in un report completo e trasparente. Con razionali in linguaggio naturale trasparenti e report esaustivi, TSci trasforma il flusso di lavoro di previsione in un sistema white-box che è sia interpretabile che estendibile tra diversi compiti. I risultati empirici su otto benchmark consolidati dimostrano che TSci supera costantemente sia i baseline statistici che quelli basati su LLM, riducendo l'errore di previsione in media del 10,4% e del 38,2%, rispettivamente. Inoltre, TSci produce un report chiaro e rigoroso che rende il flusso di lavoro di previsione più trasparente e interpretabile.
English
Time series forecasting is central to decision-making in domains as diverse
as energy, finance, climate, and public health. In practice, forecasters face
thousands of short, noisy series that vary in frequency, quality, and horizon,
where the dominant cost lies not in model fitting, but in the labor-intensive
preprocessing, validation, and ensembling required to obtain reliable
predictions. Prevailing statistical and deep learning models are tailored to
specific datasets or domains and generalize poorly. A general, domain-agnostic
framework that minimizes human intervention is urgently in demand. In this
paper, we introduce TimeSeriesScientist (TSci), the first LLM-driven agentic
framework for general time series forecasting. The framework comprises four
specialized agents: Curator performs LLM-guided diagnostics augmented by
external tools that reason over data statistics to choose targeted
preprocessing; Planner narrows the hypothesis space of model choice by
leveraging multi-modal diagnostics and self-planning over the input; Forecaster
performs model fitting and validation and, based on the results, adaptively
selects the best model configuration as well as ensemble strategy to make final
predictions; and Reporter synthesizes the whole process into a comprehensive,
transparent report. With transparent natural-language rationales and
comprehensive reports, TSci transforms the forecasting workflow into a
white-box system that is both interpretable and extensible across tasks.
Empirical results on eight established benchmarks demonstrate that TSci
consistently outperforms both statistical and LLM-based baselines, reducing
forecast error by an average of 10.4% and 38.2%, respectively. Moreover, TSci
produces a clear and rigorous report that makes the forecasting workflow more
transparent and interpretable.