SenTSR-Bench: Zeitreihenreasoning durch injiziertes Wissen

Zusammenfassung

Die zeitreihenbasierte Diagnosereasoning ist für viele Anwendungen von entscheidender Bedeutung, doch bestehende Lösungen weisen eine anhaltende Lücke auf: Allgemeine Reasoning-Großsprachmodelle (GRLMs) verfügen über starke Reasoning-Fähigkeiten, aber es fehlt ihnen an domänenspezifischem Wissen, um komplexe Zeitreihenmuster zu verstehen. Im Gegensatz dazu verstehen feinabgestimmte zeitreihenbasierte LLMs (TSLMs) diese Muster, mangelt es ihnen jedoch an der Fähigkeit, Reasoning für komplexere Fragestellungen zu verallgemeinern. Um diese Lücke zu schließen, schlagen wir ein hybrides Wissensinjizierungsframework vor, das von TSLMs generierte Erkenntnisse direkt in den Reasoning-Pfad von GRLMs injiziert und so starkes Zeitreihen-Reasoning mit domänenspezifischem Wissen ermöglicht. Da die Datensammlung für die Feinabstimmung durch Wissensinjizierung kostspielig ist, nutzen wir weiterhin einen reinforcement-learning-basierten Ansatz mit verifizierbaren Belohnungen (RLVR), um wissensreiche Reasoning-Pfade ohne menschliche Aufsicht zu generieren und diese domänenspezifischen Denkpfade in GRLMs zur effizienten Wissensinjizierung zu übertragen. Zusätzlich veröffentlichen wir SenTSR-Bench, einen Benchmark für multivariates zeitreihenbasiertes Diagnosereasoning, der aus realen industriellen Betriebsdaten erhoben wurde. Sowohl auf SenTSR-Bench als auch auf anderen öffentlichen Datensätzen übertrifft unsere Methode durchgängig TSLMs um 9,1 %–26,1 % und GRLMs um 7,9 %–22,4 % und liefert robuste, kontextbewusste Einblicke in die zeitreihenbasierte Diagnostik.

English

Time-series diagnostic reasoning is essential for many applications, yet existing solutions face a persistent gap: general reasoning large language models (GRLMs) possess strong reasoning skills but lack the domain-specific knowledge to understand complex time-series patterns. Conversely, fine-tuned time-series LLMs (TSLMs) understand these patterns but lack the capacity to generalize reasoning for more complicated questions. To bridge this gap, we propose a hybrid knowledge-injection framework that injects TSLM-generated insights directly into GRLM's reasoning trace, thereby achieving strong time-series reasoning with in-domain knowledge. As collecting data for knowledge injection fine-tuning is costly, we further leverage a reinforcement learning-based approach with verifiable rewards (RLVR) to elicit knowledge-rich traces without human supervision, then transfer such an in-domain thinking trace into GRLM for efficient knowledge injection. We further release SenTSR-Bench, a multivariate time-series-based diagnostic reasoning benchmark collected from real-world industrial operations. Across SenTSR-Bench and other public datasets, our method consistently surpasses TSLMs by 9.1%-26.1% and GRLMs by 7.9%-22.4%, delivering robust, context-aware time-series diagnostic insights.

SenTSR-Bench: Zeitreihenreasoning durch injiziertes Wissen

SenTSR-Bench: Thinking with Injected Knowledge for Time-Series Reasoning

Zusammenfassung

Support