SenTSR-Bench: Рассуждения с инжекцией знаний для временных рядов
SenTSR-Bench: Thinking with Injected Knowledge for Time-Series Reasoning
February 23, 2026
Авторы: Zelin He, Boran Han, Xiyuan Zhang, Shuai Zhang, Haotian Lin, Qi Zhu, Haoyang Fang, Danielle C. Maddix, Abdul Fatir Ansari, Akash Chandrayan, Abhinav Pradhan, Bernie Wang, Matthew Reimherr
cs.AI
Аннотация
Диагностическое рассуждение на основе временных рядов играет ключевую роль во многих приложениях, однако существующие решения сталкиваются с устойчивым разрывом: универсальные большие языковые модели (UBLM) обладают развитыми навыками логического вывода, но им не хватает предметных знаний для понимания сложных паттернов временных рядов. В свою очередь, специализированные языковые модели для временных рядов (СЯМВР) понимают эти паттерны, но не способны обобщать рассуждения для решения более сложных задач. Для преодоления этого разрыва мы предлагаем гибридную фреймворк инжекции знаний, который напрямую внедряет инсайты, сгенерированные СЯМВР, в цепочку рассуждений UBLM, достигая тем самым высококачественного анализа временных рядов с использованием предметных знаний. Поскольку сбор данных для тонкой настройки с инжекцией знаний является дорогостоящим, мы дополнительно используем подход на основе обучения с подкреплением с верифицируемыми вознаграждениями (OPV) для генерации информативных трасс рассуждений без участия человека с последующей передачей такой предметной трассы мышления в UBLM для эффективной инжекции знаний. Мы также представляем SenTSR-Bench — эталонный набор задач для диагностического анализа на основе многомерных временных рядов, собранный из реальных промышленных процессов. На SenTSR-Bench и других публичных наборах данных наш метод стабильно превосходит СЯМВР на 9.1%–26.1% и UBLM на 7.9%–22.4%, обеспечивая надежные и контекстно-зависимые диагностические инсайты для временных рядов.
English
Time-series diagnostic reasoning is essential for many applications, yet existing solutions face a persistent gap: general reasoning large language models (GRLMs) possess strong reasoning skills but lack the domain-specific knowledge to understand complex time-series patterns. Conversely, fine-tuned time-series LLMs (TSLMs) understand these patterns but lack the capacity to generalize reasoning for more complicated questions. To bridge this gap, we propose a hybrid knowledge-injection framework that injects TSLM-generated insights directly into GRLM's reasoning trace, thereby achieving strong time-series reasoning with in-domain knowledge. As collecting data for knowledge injection fine-tuning is costly, we further leverage a reinforcement learning-based approach with verifiable rewards (RLVR) to elicit knowledge-rich traces without human supervision, then transfer such an in-domain thinking trace into GRLM for efficient knowledge injection. We further release SenTSR-Bench, a multivariate time-series-based diagnostic reasoning benchmark collected from real-world industrial operations. Across SenTSR-Bench and other public datasets, our method consistently surpasses TSLMs by 9.1%-26.1% and GRLMs by 7.9%-22.4%, delivering robust, context-aware time-series diagnostic insights.