Met^2Net: Een ontkoppeld tweestaps spatio-temporeel voorspellingsmodel voor complexe meteorologische systemen
Met^2Net: A Decoupled Two-Stage Spatio-Temporal Forecasting Model for Complex Meteorological Systems
July 23, 2025
Auteurs: Shaohan Li, Hao Yang, Min Chen, Xiaolin Qin
cs.AI
Samenvatting
De toenemende frequentie van extreme weersomstandigheden als gevolg van wereldwijde klimaatverandering benadrukt de noodzaak van nauwkeurige weersvoorspellingen. Recentelijk zijn grote vooruitgangen geboekt door end-to-end methoden, dankzij deep learning-technieken, maar deze methoden kampen met beperkingen in representatie-inconsistentie bij multivariabele integratie en hebben moeite om de afhankelijkheid tussen variabelen effectief vast te leggen, wat essentieel is in complexe weersystemen. Door verschillende variabelen als afzonderlijke modaliteiten te behandelen en een tweefasige trainingsaanpak uit multimodale modellen toe te passen, kan dit probleem gedeeltelijk worden verlicht, maar door de inconsistentie in trainings taken tussen de twee fasen zijn de resultaten vaak suboptimaal. Om deze uitdagingen aan te pakken, stellen we een impliciete tweefasige trainingsmethode voor, waarbij afzonderlijke encoders en decoders voor elke variabele worden geconfigureerd. In detail: in de eerste fase wordt de Translator bevroren terwijl de Encoders en Decoders een gedeelde latente ruimte leren, in de tweede fase worden de Encoders en Decoders bevroren en legt de Translator de interacties tussen variabelen vast voor voorspellingen. Daarnaast wordt door de introductie van een self-attention-mechanisme voor multivariabele fusie in de latente ruimte de prestaties verder verbeterd. Empirisch tonen uitgebreide experimenten de state-of-the-art prestaties van onze methode aan. Specifiek reduceert het de MSE voor voorspellingen van de nabije oppervlakteluchttemperatuur en relatieve luchtvochtigheid met respectievelijk 28,82% en 23,39%. De broncode is beschikbaar op https://github.com/ShremG/Met2Net.
English
The increasing frequency of extreme weather events due to global climate
change urges accurate weather prediction. Recently, great advances have been
made by the end-to-end methods, thanks to deep learning techniques,
but they face limitations of representation inconsistency in
multivariable integration and struggle to effectively capture the dependency
between variables, which is required in complex weather systems. Treating
different variables as distinct modalities and applying a two-stage
training approach from multimodal models can partially alleviate this issue,
but due to the inconformity in training tasks between the two stages, the
results are often suboptimal. To address these challenges, we propose an
implicit two-stage training method, configuring separate encoders and decoders
for each variable. In detailed, in the first stage, the Translator is frozen
while the Encoders and Decoders learn a shared latent space, in the second
stage, the Encoders and Decoders are frozen, and the Translator captures
inter-variable interactions for prediction. Besides, by introducing a
self-attention mechanism for multivariable fusion in the latent space, the
performance achieves further improvements. Empirically, extensive experiments
show the state-of-the-art performance of our method. Specifically, it reduces
the MSE for near-surface air temperature and relative humidity predictions by
28.82\% and 23.39\%, respectively. The source code is available at
https://github.com/ShremG/Met2Net.