SenTSR-Bench: Razonamiento con Conocimiento Inyectado para Series Temporales

Resumen

El razonamiento diagnóstico de series temporales es esencial para muchas aplicaciones, pero las soluciones existentes enfrentan una brecha persistente: los modelos de lenguaje de gran tamaño de razonamiento general (GRLM) poseen fuertes habilidades de razonamiento pero carecen del conocimiento específico del dominio para comprender patrones complejos de series temporales. Por el contrario, los LLM de series temporales ajustados (TSLM) comprenden estos patrones pero carecen de la capacidad para generalizar el razonamiento hacia preguntas más complejas. Para cerrar esta brecha, proponemos un marco híbrido de inyección de conocimiento que inyecta las percepciones generadas por el TSLM directamente en la traza de razonamiento del GRLM, logrando así un razonamiento sólido sobre series temporales con conocimiento del dominio. Dado que la recopilación de datos para el ajuste fino por inyección de conocimiento es costosa, aprovechamos además un enfoque basado en aprendizaje por refuerzo con recompensas verificables (RLVR) para obtener trazas ricas en conocimiento sin supervisión humana, transfiriendo luego dicha traza de pensamiento del dominio al GRLM para una inyección de conocimiento eficiente. Además, publicamos SenTSR-Bench, un benchmark de razonamiento diagnóstico basado en series temporales multivariante recopilado de operaciones industriales del mundo real. Tanto en SenTSR-Bench como en otros conjuntos de datos públicos, nuestro método supera consistentemente a los TSLM en un 9.1%-26.1% y a los GRLM en un 7.9%-22.4%, ofreciendo percepciones diagnósticas de series temporales robustas y conscientes del contexto.

English

Time-series diagnostic reasoning is essential for many applications, yet existing solutions face a persistent gap: general reasoning large language models (GRLMs) possess strong reasoning skills but lack the domain-specific knowledge to understand complex time-series patterns. Conversely, fine-tuned time-series LLMs (TSLMs) understand these patterns but lack the capacity to generalize reasoning for more complicated questions. To bridge this gap, we propose a hybrid knowledge-injection framework that injects TSLM-generated insights directly into GRLM's reasoning trace, thereby achieving strong time-series reasoning with in-domain knowledge. As collecting data for knowledge injection fine-tuning is costly, we further leverage a reinforcement learning-based approach with verifiable rewards (RLVR) to elicit knowledge-rich traces without human supervision, then transfer such an in-domain thinking trace into GRLM for efficient knowledge injection. We further release SenTSR-Bench, a multivariate time-series-based diagnostic reasoning benchmark collected from real-world industrial operations. Across SenTSR-Bench and other public datasets, our method consistently surpasses TSLMs by 9.1%-26.1% and GRLMs by 7.9%-22.4%, delivering robust, context-aware time-series diagnostic insights.

SenTSR-Bench: Razonamiento con Conocimiento Inyectado para Series Temporales

SenTSR-Bench: Thinking with Injected Knowledge for Time-Series Reasoning

Resumen

Support