Met^2Net: Ein entkoppeltes zweistufiges räumlich-zeitliches Prognosemodell für komplexe meteorologische Systeme
Met^2Net: A Decoupled Two-Stage Spatio-Temporal Forecasting Model for Complex Meteorological Systems
July 23, 2025
papers.authors: Shaohan Li, Hao Yang, Min Chen, Xiaolin Qin
cs.AI
papers.abstract
Die zunehmende Häufigkeit extremer Wetterereignisse aufgrund des globalen Klimawandels erfordert eine präzise Wettervorhersage. In jüngster Zeit wurden durch end-to-end-Methoden, dank der Fortschritte in der Deep-Learning-Technologie, große Fortschritte erzielt. Diese Methoden stoßen jedoch auf Grenzen bei der Inkonsistenz der Darstellung in der multivariablen Integration und haben Schwierigkeiten, die Abhängigkeiten zwischen Variablen effektiv zu erfassen, was in komplexen Wettersystemen erforderlich ist. Die Behandlung verschiedener Variablen als unterschiedliche Modalitäten und die Anwendung eines zweistufigen Trainingsansatzes aus multimodalen Modellen kann dieses Problem teilweise lindern. Aufgrund der Unvereinbarkeit der Trainingsaufgaben zwischen den beiden Stufen sind die Ergebnisse jedoch oft suboptimal. Um diese Herausforderungen zu bewältigen, schlagen wir eine implizite zweistufige Trainingsmethode vor, die separate Encoder und Decoder für jede Variable konfiguriert. Im Detail wird in der ersten Stufe der Translator eingefroren, während die Encoder und Decoder einen gemeinsamen latenten Raum erlernen. In der zweiten Stufe werden die Encoder und Decoder eingefroren, und der Translator erfasst die Interaktionen zwischen den Variablen für die Vorhersage. Darüber hinaus wird durch die Einführung eines Selbstaufmerksamkeitsmechanismus für die multivariable Fusion im latenten Raum die Leistung weiter verbessert. Empirisch zeigen umfangreiche Experimente die state-of-the-art-Leistung unserer Methode. Insbesondere reduziert sie den mittleren quadratischen Fehler (MSE) für die Vorhersage der bodennahen Lufttemperatur und der relativen Luftfeuchtigkeit um 28,82 % bzw. 23,39 %. Der Quellcode ist unter https://github.com/ShremG/Met2Net verfügbar.
English
The increasing frequency of extreme weather events due to global climate
change urges accurate weather prediction. Recently, great advances have been
made by the end-to-end methods, thanks to deep learning techniques,
but they face limitations of representation inconsistency in
multivariable integration and struggle to effectively capture the dependency
between variables, which is required in complex weather systems. Treating
different variables as distinct modalities and applying a two-stage
training approach from multimodal models can partially alleviate this issue,
but due to the inconformity in training tasks between the two stages, the
results are often suboptimal. To address these challenges, we propose an
implicit two-stage training method, configuring separate encoders and decoders
for each variable. In detailed, in the first stage, the Translator is frozen
while the Encoders and Decoders learn a shared latent space, in the second
stage, the Encoders and Decoders are frozen, and the Translator captures
inter-variable interactions for prediction. Besides, by introducing a
self-attention mechanism for multivariable fusion in the latent space, the
performance achieves further improvements. Empirically, extensive experiments
show the state-of-the-art performance of our method. Specifically, it reduces
the MSE for near-surface air temperature and relative humidity predictions by
28.82\% and 23.39\%, respectively. The source code is available at
https://github.com/ShremG/Met2Net.