TimeSeriesScientist: Ein universeller KI-Agent für die Zeitreihenanalyse
TimeSeriesScientist: A General-Purpose AI Agent for Time Series Analysis
October 2, 2025
papers.authors: Haokun Zhao, Xiang Zhang, Jiaqi Wei, Yiwei Xu, Yuting He, Siqi Sun, Chenyu You
cs.AI
papers.abstract
Zeitreihenvorhersage ist von zentraler Bedeutung für die Entscheidungsfindung in so unterschiedlichen Bereichen wie Energie, Finanzen, Klima und öffentliche Gesundheit. In der Praxis sehen sich Prognostiker mit Tausenden von kurzen, verrauschten Reihen konfrontiert, die sich in Frequenz, Qualität und Horizont unterscheiden, wobei die dominierenden Kosten nicht in der Modellanpassung, sondern in der arbeitsintensiven Vorverarbeitung, Validierung und Ensemble-Bildung liegen, die erforderlich sind, um zuverlässige Vorhersagen zu erhalten. Vorherrschende statistische und Deep-Learning-Modelle sind auf spezifische Datensätze oder Domänen zugeschnitten und generalisieren schlecht. Ein allgemeines, domänenunabhängiges Framework, das den menschlichen Eingriff minimiert, wird dringend benötigt. In diesem Artikel stellen wir TimeSeriesScientist (TSci) vor, das erste LLM-gestützte agentenbasierte Framework für allgemeine Zeitreihenvorhersagen. Das Framework besteht aus vier spezialisierten Agenten: Der Kurator führt LLM-gestützte Diagnosen durch, die durch externe Tools ergänzt werden, die über Datenstatistiken nachdenken, um gezielte Vorverarbeitung auszuwählen; der Planer verengt den Hypothesenraum der Modellauswahl durch die Nutzung multimodaler Diagnosen und Selbstplanung über die Eingabe; der Prognostiker führt Modellanpassung und Validierung durch und wählt basierend auf den Ergebnissen adaptiv die beste Modellkonfiguration sowie die Ensemble-Strategie aus, um endgültige Vorhersagen zu treffen; und der Berichterstatter fasst den gesamten Prozess in einem umfassenden, transparenten Bericht zusammen. Mit transparenten, natürlichen Sprachbegründungen und umfassenden Berichten verwandelt TSci den Prognoseprozess in ein White-Box-System, das sowohl interpretierbar als auch über Aufgaben hinweg erweiterbar ist. Empirische Ergebnisse auf acht etablierten Benchmarks zeigen, dass TSci sowohl statistische als auch LLM-basierte Baselines konsequent übertrifft und den Prognosefehler im Durchschnitt um 10,4 % bzw. 38,2 % reduziert. Darüber hinaus erstellt TSci einen klaren und rigorosen Bericht, der den Prognoseprozess transparenter und interpretierbarer macht.
English
Time series forecasting is central to decision-making in domains as diverse
as energy, finance, climate, and public health. In practice, forecasters face
thousands of short, noisy series that vary in frequency, quality, and horizon,
where the dominant cost lies not in model fitting, but in the labor-intensive
preprocessing, validation, and ensembling required to obtain reliable
predictions. Prevailing statistical and deep learning models are tailored to
specific datasets or domains and generalize poorly. A general, domain-agnostic
framework that minimizes human intervention is urgently in demand. In this
paper, we introduce TimeSeriesScientist (TSci), the first LLM-driven agentic
framework for general time series forecasting. The framework comprises four
specialized agents: Curator performs LLM-guided diagnostics augmented by
external tools that reason over data statistics to choose targeted
preprocessing; Planner narrows the hypothesis space of model choice by
leveraging multi-modal diagnostics and self-planning over the input; Forecaster
performs model fitting and validation and, based on the results, adaptively
selects the best model configuration as well as ensemble strategy to make final
predictions; and Reporter synthesizes the whole process into a comprehensive,
transparent report. With transparent natural-language rationales and
comprehensive reports, TSci transforms the forecasting workflow into a
white-box system that is both interpretable and extensible across tasks.
Empirical results on eight established benchmarks demonstrate that TSci
consistently outperforms both statistical and LLM-based baselines, reducing
forecast error by an average of 10.4% and 38.2%, respectively. Moreover, TSci
produces a clear and rigorous report that makes the forecasting workflow more
transparent and interpretable.