TimeSeriesScientist: Универсальный ИИ-агент для анализа временных рядов
TimeSeriesScientist: A General-Purpose AI Agent for Time Series Analysis
October 2, 2025
Авторы: Haokun Zhao, Xiang Zhang, Jiaqi Wei, Yiwei Xu, Yuting He, Siqi Sun, Chenyu You
cs.AI
Аннотация
Прогнозирование временных рядов играет ключевую роль в принятии решений в таких разнообразных областях, как энергетика, финансы, климат и общественное здравоохранение. На практике специалисты сталкиваются с тысячами коротких, зашумленных рядов, которые различаются по частоте, качеству и горизонту прогнозирования, при этом основные затраты связаны не с подгонкой модели, а с трудоемкими этапами предварительной обработки, валидации и ансамблирования, необходимыми для получения надежных прогнозов. Преобладающие статистические и модели глубокого обучения адаптированы к конкретным наборам данных или областям и плохо обобщаются. Существует острая потребность в универсальной, независимой от предметной области системе, которая минимизирует вмешательство человека. В данной работе мы представляем TimeSeriesScientist (TSci) — первую агентную платформу на основе больших языковых моделей (LLM) для универсального прогнозирования временных рядов. Платформа включает четыре специализированных агента: Curator выполняет диагностику с использованием LLM, дополненную внешними инструментами, которые анализируют статистику данных для выбора целевой предварительной обработки; Planner сужает пространство гипотез выбора модели, используя мультимодальную диагностику и самоорганизацию на основе входных данных; Forecaster выполняет подгонку и валидацию модели и на основе результатов адаптивно выбирает оптимальную конфигурацию модели, а также стратегию ансамблирования для получения итоговых прогнозов; Reporter синтезирует весь процесс в прозрачный и детализированный отчет. Благодаря прозрачным обоснованиям на естественном языке и подробным отчетам TSci превращает процесс прогнозирования в "белый ящик", который является интерпретируемым и расширяемым для различных задач. Эмпирические результаты на восьми известных бенчмарках показывают, что TSci стабильно превосходит как статистические, так и LLM-базовые методы, снижая ошибку прогнозирования в среднем на 10,4% и 38,2% соответственно. Более того, TSci создает четкий и строгий отчет, делая процесс прогнозирования более прозрачным и интерпретируемым.
English
Time series forecasting is central to decision-making in domains as diverse
as energy, finance, climate, and public health. In practice, forecasters face
thousands of short, noisy series that vary in frequency, quality, and horizon,
where the dominant cost lies not in model fitting, but in the labor-intensive
preprocessing, validation, and ensembling required to obtain reliable
predictions. Prevailing statistical and deep learning models are tailored to
specific datasets or domains and generalize poorly. A general, domain-agnostic
framework that minimizes human intervention is urgently in demand. In this
paper, we introduce TimeSeriesScientist (TSci), the first LLM-driven agentic
framework for general time series forecasting. The framework comprises four
specialized agents: Curator performs LLM-guided diagnostics augmented by
external tools that reason over data statistics to choose targeted
preprocessing; Planner narrows the hypothesis space of model choice by
leveraging multi-modal diagnostics and self-planning over the input; Forecaster
performs model fitting and validation and, based on the results, adaptively
selects the best model configuration as well as ensemble strategy to make final
predictions; and Reporter synthesizes the whole process into a comprehensive,
transparent report. With transparent natural-language rationales and
comprehensive reports, TSci transforms the forecasting workflow into a
white-box system that is both interpretable and extensible across tasks.
Empirical results on eight established benchmarks demonstrate that TSci
consistently outperforms both statistical and LLM-based baselines, reducing
forecast error by an average of 10.4% and 38.2%, respectively. Moreover, TSci
produces a clear and rigorous report that makes the forecasting workflow more
transparent and interpretable.