TimeSeriesScientist: Um Agente de IA de Propósito Geral para Análise de Séries Temporais
TimeSeriesScientist: A General-Purpose AI Agent for Time Series Analysis
October 2, 2025
Autores: Haokun Zhao, Xiang Zhang, Jiaqi Wei, Yiwei Xu, Yuting He, Siqi Sun, Chenyu You
cs.AI
Resumo
A previsão de séries temporais é fundamental para a tomada de decisões em domínios tão diversos como energia, finanças, clima e saúde pública. Na prática, os analistas enfrentam milhares de séries curtas e ruidosas que variam em frequência, qualidade e horizonte, onde o custo dominante não está no ajuste do modelo, mas no pré-processamento, validação e combinação de modelos intensivos em mão de obra necessários para obter previsões confiáveis. Os modelos estatísticos e de aprendizado profundo predominantes são adaptados a conjuntos de dados ou domínios específicos e generalizam mal. Um framework geral e independente de domínio que minimize a intervenção humana é urgentemente necessário. Neste artigo, apresentamos o TimeSeriesScientist (TSci), o primeiro framework agentivo baseado em LLM para previsão geral de séries temporais. O framework é composto por quatro agentes especializados: o Curador realiza diagnósticos guiados por LLM, aumentados por ferramentas externas que raciocinam sobre estatísticas dos dados para escolher o pré-processamento direcionado; o Planejador reduz o espaço de hipóteses de escolha de modelo, aproveitando diagnósticos multimodais e autoplanejamento sobre a entrada; o Previsor realiza o ajuste e validação do modelo e, com base nos resultados, seleciona adaptativamente a melhor configuração de modelo, bem como a estratégia de combinação de modelos para fazer previsões finais; e o Relator sintetiza todo o processo em um relatório abrangente e transparente. Com justificativas transparentes em linguagem natural e relatórios abrangentes, o TSci transforma o fluxo de trabalho de previsão em um sistema de caixa branca que é tanto interpretável quanto extensível entre tarefas. Resultados empíricos em oito benchmarks estabelecidos demonstram que o TSci supera consistentemente as linhas de base estatísticas e baseadas em LLM, reduzindo o erro de previsão em média em 10,4% e 38,2%, respectivamente. Além disso, o TSci produz um relatório claro e rigoroso que torna o fluxo de trabalho de previsão mais transparente e interpretável.
English
Time series forecasting is central to decision-making in domains as diverse
as energy, finance, climate, and public health. In practice, forecasters face
thousands of short, noisy series that vary in frequency, quality, and horizon,
where the dominant cost lies not in model fitting, but in the labor-intensive
preprocessing, validation, and ensembling required to obtain reliable
predictions. Prevailing statistical and deep learning models are tailored to
specific datasets or domains and generalize poorly. A general, domain-agnostic
framework that minimizes human intervention is urgently in demand. In this
paper, we introduce TimeSeriesScientist (TSci), the first LLM-driven agentic
framework for general time series forecasting. The framework comprises four
specialized agents: Curator performs LLM-guided diagnostics augmented by
external tools that reason over data statistics to choose targeted
preprocessing; Planner narrows the hypothesis space of model choice by
leveraging multi-modal diagnostics and self-planning over the input; Forecaster
performs model fitting and validation and, based on the results, adaptively
selects the best model configuration as well as ensemble strategy to make final
predictions; and Reporter synthesizes the whole process into a comprehensive,
transparent report. With transparent natural-language rationales and
comprehensive reports, TSci transforms the forecasting workflow into a
white-box system that is both interpretable and extensible across tasks.
Empirical results on eight established benchmarks demonstrate that TSci
consistently outperforms both statistical and LLM-based baselines, reducing
forecast error by an average of 10.4% and 38.2%, respectively. Moreover, TSci
produces a clear and rigorous report that makes the forecasting workflow more
transparent and interpretable.