SenTSR-Bench: Ragionamento con Conoscenza Iniettata per l'Analisi di Serie Temporali
SenTSR-Bench: Thinking with Injected Knowledge for Time-Series Reasoning
February 23, 2026
Autori: Zelin He, Boran Han, Xiyuan Zhang, Shuai Zhang, Haotian Lin, Qi Zhu, Haoyang Fang, Danielle C. Maddix, Abdul Fatir Ansari, Akash Chandrayan, Abhinav Pradhan, Bernie Wang, Matthew Reimherr
cs.AI
Abstract
Il ragionamento diagnostico basato su serie temporali è essenziale per molte applicazioni, ma le soluzioni esistenti affrontano un divario persistente: i modelli linguistici di grandi dimensioni per il ragionamento generale (GRLM) possiedono forti capacità deduttive ma mancano della conoscenza specifica del dominio per comprendere modelli complessi delle serie temporali. Al contrario, i modelli linguistici di grandi dimensioni specializzati su serie temporali (TSLM) comprendono questi modelli ma non hanno la capacità di generalizzare il ragionamento per domande più complesse. Per colmare questa lacuna, proponiamo un framework ibrido di iniezione della conoscenza che inietta direttamente le intuizioni generate dai TSLM nella traccia di ragionamento dei GRLM, ottenendo così un ragionamento robusto sulle serie temporali con conoscenza di dominio. Poiché la raccolta di dati per il fine-tuning tramite iniezione di conoscenza è costosa, sfruttiamo ulteriormente un approccio basato sull'apprendimento per rinforzo con ricompense verificabili (RLVR) per elicitare tracce ricche di conoscenza senza supervisione umana, trasferendo poi questa traccia di pensiero di dominio nei GRLM per un'efficiente iniezione di conoscenza. Rilasciamo inoltre SenTSR-Bench, un benchmark per il ragionamento diagnostico basato su serie temporali multivariate raccolte da operazioni industriali reali. Su SenTSR-Bench e altri dataset pubblici, il nostro metodo supera costantemente i TSLM del 9,1%-26,1% e i GRLM del 7,9%-22,4%, fornendo intuizioni diagnostiche robuste e contestuali per le serie temporali.
English
Time-series diagnostic reasoning is essential for many applications, yet existing solutions face a persistent gap: general reasoning large language models (GRLMs) possess strong reasoning skills but lack the domain-specific knowledge to understand complex time-series patterns. Conversely, fine-tuned time-series LLMs (TSLMs) understand these patterns but lack the capacity to generalize reasoning for more complicated questions. To bridge this gap, we propose a hybrid knowledge-injection framework that injects TSLM-generated insights directly into GRLM's reasoning trace, thereby achieving strong time-series reasoning with in-domain knowledge. As collecting data for knowledge injection fine-tuning is costly, we further leverage a reinforcement learning-based approach with verifiable rewards (RLVR) to elicit knowledge-rich traces without human supervision, then transfer such an in-domain thinking trace into GRLM for efficient knowledge injection. We further release SenTSR-Bench, a multivariate time-series-based diagnostic reasoning benchmark collected from real-world industrial operations. Across SenTSR-Bench and other public datasets, our method consistently surpasses TSLMs by 9.1%-26.1% and GRLMs by 7.9%-22.4%, delivering robust, context-aware time-series diagnostic insights.