ChatPaper.aiChatPaper

TimeSeriesScientist: Een Algemeen Toepasbare AI-Agent voor Tijdreeksanalyse

TimeSeriesScientist: A General-Purpose AI Agent for Time Series Analysis

October 2, 2025
Auteurs: Haokun Zhao, Xiang Zhang, Jiaqi Wei, Yiwei Xu, Yuting He, Siqi Sun, Chenyu You
cs.AI

Samenvatting

Tijdreeksvoorspelling is van cruciaal belang voor besluitvorming in domeinen zo divers als energie, financiën, klimaat en volksgezondheid. In de praktijk worden voorspellers geconfronteerd met duizenden korte, ruisachtige reeksen die variëren in frequentie, kwaliteit en horizon, waarbij de dominante kosten niet liggen in het aanpassen van modellen, maar in de arbeidsintensieve preprocessing, validatie en ensembling die nodig zijn om betrouwbare voorspellingen te verkrijgen. Gangbare statistische en deep learning-modellen zijn afgestemd op specifieke datasets of domeinen en generaliseren slecht. Een algemeen, domein-agnostisch framework dat menselijke interventie minimaliseert, is dringend nodig. In dit artikel introduceren we TimeSeriesScientist (TSci), het eerste LLM-gestuurde agent-gebaseerde framework voor algemene tijdreeksvoorspelling. Het framework bestaat uit vier gespecialiseerde agents: Curator voert LLM-gestuurde diagnostiek uit, aangevuld met externe tools die redeneren over data-statistieken om gerichte preprocessing te kiezen; Planner verkleint de hypothese-ruimte van modelkeuze door gebruik te maken van multi-modale diagnostiek en zelfplanning over de input; Forecaster voert modelaanpassing en validatie uit en selecteert adaptief de beste modelconfiguratie en ensemble-strategie om uiteindelijke voorspellingen te maken; en Reporter synthetiseert het hele proces in een uitgebreid, transparant rapport. Met transparante, natuurlijke-taalredeneringen en uitgebreide rapporten transformeert TSci de voorspellingsworkflow in een white-box systeem dat zowel interpreteerbaar als uitbreidbaar is over taken heen. Empirische resultaten op acht gevestigde benchmarks tonen aan dat TSci consistent beter presteert dan zowel statistische als LLM-gebaseerde baseline-modellen, waarbij de voorspellingsfout gemiddeld met respectievelijk 10,4% en 38,2% wordt verminderd. Bovendien produceert TSci een duidelijk en rigoureus rapport dat de voorspellingsworkflow transparanter en interpreteerbaarder maakt.
English
Time series forecasting is central to decision-making in domains as diverse as energy, finance, climate, and public health. In practice, forecasters face thousands of short, noisy series that vary in frequency, quality, and horizon, where the dominant cost lies not in model fitting, but in the labor-intensive preprocessing, validation, and ensembling required to obtain reliable predictions. Prevailing statistical and deep learning models are tailored to specific datasets or domains and generalize poorly. A general, domain-agnostic framework that minimizes human intervention is urgently in demand. In this paper, we introduce TimeSeriesScientist (TSci), the first LLM-driven agentic framework for general time series forecasting. The framework comprises four specialized agents: Curator performs LLM-guided diagnostics augmented by external tools that reason over data statistics to choose targeted preprocessing; Planner narrows the hypothesis space of model choice by leveraging multi-modal diagnostics and self-planning over the input; Forecaster performs model fitting and validation and, based on the results, adaptively selects the best model configuration as well as ensemble strategy to make final predictions; and Reporter synthesizes the whole process into a comprehensive, transparent report. With transparent natural-language rationales and comprehensive reports, TSci transforms the forecasting workflow into a white-box system that is both interpretable and extensible across tasks. Empirical results on eight established benchmarks demonstrate that TSci consistently outperforms both statistical and LLM-based baselines, reducing forecast error by an average of 10.4% and 38.2%, respectively. Moreover, TSci produces a clear and rigorous report that makes the forecasting workflow more transparent and interpretable.
PDF52October 3, 2025