SenTSR-Bench : Raisonnement avec des connaissances injectées pour l'analyse de séries temporelles

Résumé

Le raisonnement diagnostique des séries temporelles est essentiel pour de nombreuses applications, mais les solutions existantes font face à un écart persistant : les modèles de langage généraux à capacités de raisonnement (GRLM) possèdent de solides compétences déductives mais manquent de connaissances spécifiques pour comprendre les motifs complexes des séries temporelles. À l'inverse, les modèles de langage spécialisés en séries temporelles (TSLM) comprennent ces motifs mais manquent de capacité à généraliser leur raisonnement pour des questions plus complexes. Pour combler cet écart, nous proposons un cadre hybride d'injection de connaissances qui intègre directement les insights générés par les TSLM dans la trace de raisonnement des GRLM, permettant ainsi un raisonnement temporel solide avec des connaissances du domaine. Comme la collecte de données pour l'affinage par injection de connaissances est coûteuse, nous exploitons une approche par apprentissage par renforcement avec récompenses vérifiables (RLVR) pour produire des traces riches en connaissances sans supervision humaine, puis transférons cette trace de réflexion spécialisée dans les GRLM pour une injection de connaissances efficace. Nous publions également SenTSR-Bench, un benchmark de raisonnement diagnostique basé sur des séries temporelles multivariées collectées lors d'opérations industrielles réelles. Sur SenTSR-Bench et d'autres jeux de données publics, notre méthode surpasse constamment les TSLM de 9,1 % à 26,1 % et les GRLM de 7,9 % à 22,4 %, fournissant des insights diagnostiques robustes et contextuels pour les séries temporelles.

English

Time-series diagnostic reasoning is essential for many applications, yet existing solutions face a persistent gap: general reasoning large language models (GRLMs) possess strong reasoning skills but lack the domain-specific knowledge to understand complex time-series patterns. Conversely, fine-tuned time-series LLMs (TSLMs) understand these patterns but lack the capacity to generalize reasoning for more complicated questions. To bridge this gap, we propose a hybrid knowledge-injection framework that injects TSLM-generated insights directly into GRLM's reasoning trace, thereby achieving strong time-series reasoning with in-domain knowledge. As collecting data for knowledge injection fine-tuning is costly, we further leverage a reinforcement learning-based approach with verifiable rewards (RLVR) to elicit knowledge-rich traces without human supervision, then transfer such an in-domain thinking trace into GRLM for efficient knowledge injection. We further release SenTSR-Bench, a multivariate time-series-based diagnostic reasoning benchmark collected from real-world industrial operations. Across SenTSR-Bench and other public datasets, our method consistently surpasses TSLMs by 9.1%-26.1% and GRLMs by 7.9%-22.4%, delivering robust, context-aware time-series diagnostic insights.

SenTSR-Bench : Raisonnement avec des connaissances injectées pour l'analyse de séries temporelles

SenTSR-Bench: Thinking with Injected Knowledge for Time-Series Reasoning

Résumé

Support