Met^2Net: Un modelo de pronóstico espacio-temporal en dos etapas desacoplado para sistemas meteorológicos complejos
Met^2Net: A Decoupled Two-Stage Spatio-Temporal Forecasting Model for Complex Meteorological Systems
July 23, 2025
Autores: Shaohan Li, Hao Yang, Min Chen, Xiaolin Qin
cs.AI
Resumen
El aumento en la frecuencia de eventos climáticos extremos debido al cambio climático global exige una predicción meteorológica precisa. Recientemente, se han logrado avances significativos mediante métodos de extremo a extremo, gracias a las técnicas de aprendizaje profundo, pero estos enfrentan limitaciones en la inconsistencia de representación en la integración multivariable y tienen dificultades para capturar eficazmente la dependencia entre variables, la cual es necesaria en sistemas climáticos complejos. Tratar diferentes variables como modalidades distintas y aplicar un enfoque de entrenamiento en dos etapas basado en modelos multimodales puede aliviar parcialmente este problema, pero debido a la falta de conformidad en las tareas de entrenamiento entre las dos etapas, los resultados suelen ser subóptimos. Para abordar estos desafíos, proponemos un método de entrenamiento implícito en dos etapas, configurando codificadores y decodificadores separados para cada variable. En detalle, en la primera etapa, el Traductor se congela mientras que los Codificadores y Decodificadores aprenden un espacio latente compartido; en la segunda etapa, los Codificadores y Decodificadores se congelan, y el Traductor captura las interacciones entre variables para la predicción. Además, al introducir un mecanismo de autoatención para la fusión multivariable en el espacio latente, se logran mejoras adicionales en el rendimiento. Empíricamente, experimentos extensos demuestran el rendimiento de vanguardia de nuestro método. Específicamente, reduce el error cuadrático medio (MSE) en las predicciones de temperatura del aire cerca de la superficie y humedad relativa en un 28.82% y 23.39%, respectivamente. El código fuente está disponible en https://github.com/ShremG/Met2Net.
English
The increasing frequency of extreme weather events due to global climate
change urges accurate weather prediction. Recently, great advances have been
made by the end-to-end methods, thanks to deep learning techniques,
but they face limitations of representation inconsistency in
multivariable integration and struggle to effectively capture the dependency
between variables, which is required in complex weather systems. Treating
different variables as distinct modalities and applying a two-stage
training approach from multimodal models can partially alleviate this issue,
but due to the inconformity in training tasks between the two stages, the
results are often suboptimal. To address these challenges, we propose an
implicit two-stage training method, configuring separate encoders and decoders
for each variable. In detailed, in the first stage, the Translator is frozen
while the Encoders and Decoders learn a shared latent space, in the second
stage, the Encoders and Decoders are frozen, and the Translator captures
inter-variable interactions for prediction. Besides, by introducing a
self-attention mechanism for multivariable fusion in the latent space, the
performance achieves further improvements. Empirically, extensive experiments
show the state-of-the-art performance of our method. Specifically, it reduces
the MSE for near-surface air temperature and relative humidity predictions by
28.82\% and 23.39\%, respectively. The source code is available at
https://github.com/ShremG/Met2Net.