SenTSR-Bench: Redeneren met Geïnjecteerde Kennis voor Tijdreeksanalyse

Samenvatting

Tijdreeksdiagnostiek is essentieel voor veel toepassingen, maar bestaande oplossingen kampen met een hardnekkige kloof: algemene redeneer-large-language-modellen (GRLM's) beschikken over sterke redeneervaardigheden maar missen de domeinspecifieke kennis om complexe tijdreekspatronen te begrijpen. Gefinetunede tijdreeks-LLM's (TSLM's) begrijpen deze patronen daarentegen wel, maar missen het vermogen om te generaliseren bij complexere vragen. Om deze kloof te overbruggen, stellen we een hybride kennisinjectie-framework voor dat inzichten gegenereerd door TSLM's direct injecteert in de redeneertrace van een GRLM, waardoor sterke tijdreeksredenering met domeinkennis wordt bereikt. Omdat het verzamelen van data voor finetuning via kennisinjectie kostbaar is, benutten we verder een op reinforcement learning gebaseerde aanpak met verifieerbare beloningen (RLVR) om kennisrijke redeneertrajecten zonder menselijke supervisie te genereren, en vervolgens dit domeinspecifieke denkspoor over te dragen naar de GRLM voor efficiënte kennisinjectie. We lanceren tevens SenTSR-Bench, een multivariate tijdreeksgebaseerde diagnostische redeneerbenchmark, verzameld uit real-world industriële operaties. Op zowel SenTSR-Bench als andere publieke datasets overtreft onze methode consistent TSLM's met 9.1%-26.1% en GRLM's met 7.9%-22.4%, en levert ze robuuste, contextbewuste diagnostische inzichten voor tijdreeksen.

English

Time-series diagnostic reasoning is essential for many applications, yet existing solutions face a persistent gap: general reasoning large language models (GRLMs) possess strong reasoning skills but lack the domain-specific knowledge to understand complex time-series patterns. Conversely, fine-tuned time-series LLMs (TSLMs) understand these patterns but lack the capacity to generalize reasoning for more complicated questions. To bridge this gap, we propose a hybrid knowledge-injection framework that injects TSLM-generated insights directly into GRLM's reasoning trace, thereby achieving strong time-series reasoning with in-domain knowledge. As collecting data for knowledge injection fine-tuning is costly, we further leverage a reinforcement learning-based approach with verifiable rewards (RLVR) to elicit knowledge-rich traces without human supervision, then transfer such an in-domain thinking trace into GRLM for efficient knowledge injection. We further release SenTSR-Bench, a multivariate time-series-based diagnostic reasoning benchmark collected from real-world industrial operations. Across SenTSR-Bench and other public datasets, our method consistently surpasses TSLMs by 9.1%-26.1% and GRLMs by 7.9%-22.4%, delivering robust, context-aware time-series diagnostic insights.

SenTSR-Bench: Redeneren met Geïnjecteerde Kennis voor Tijdreeksanalyse

SenTSR-Bench: Thinking with Injected Knowledge for Time-Series Reasoning

Samenvatting

Support