SEEDS : Émulation d'ensembles de prévisions météorologiques avec des modèles de diffusion
SEEDS: Emulation of Weather Forecast Ensembles with Diffusion Models
June 24, 2023
Auteurs: Lizao Li, Rob Carver, Ignacio Lopez-Gomez, Fei Sha, John Anderson
cs.AI
Résumé
La prévision probabiliste est cruciale pour la prise de décision face à l'incertitude concernant les conditions météorologiques futures. L'approche dominante consiste à utiliser un ensemble de prévisions pour représenter et quantifier l'incertitude dans la prévision numérique opérationnelle du temps. Cependant, la génération de ces ensembles est coûteuse en termes de calcul. Dans cet article, nous proposons de générer des ensembles de prévisions à grande échelle en exploitant les avancées récentes en intelligence artificielle générative. Notre approche apprend un modèle probabiliste de diffusion basé sur les données à partir de l'ensemble de réanalyses GEFS à 5 membres. Ce modèle peut ensuite être échantillonné efficacement pour produire des prévisions météorologiques réalistes, conditionnées par quelques membres du système opérationnel de prévision GEFS. Les ensembles générés présentent une compétence prédictive similaire à celle de l'ensemble complet GEFS à 31 membres, évaluée par rapport aux réanalyses ERA5, et reproduisent bien les statistiques des grands ensembles basés sur la physique. Nous appliquons également la même méthodologie pour développer un modèle de diffusion pour le post-traitement génératif : le modèle apprend directement à corriger les biais présents dans le système de prévision émulé en exploitant les données de réanalyse comme étiquettes pendant l'entraînement. Les ensembles issus de ce modèle de post-traitement génératif montrent une plus grande fiabilité et précision, en particulier dans la classification des événements extrêmes. En général, ils sont plus fiables et prévoient la probabilité des conditions météorologiques extrêmes avec plus de précision que l'ensemble opérationnel GEFS. Nos modèles atteignent ces résultats à moins d'un dixième du coût de calcul engendré par le système opérationnel GEFS.
English
Probabilistic forecasting is crucial to decision-making under uncertainty
about future weather. The dominant approach is to use an ensemble of forecasts
to represent and quantify uncertainty in operational numerical weather
prediction. However, generating ensembles is computationally costly. In this
paper, we propose to generate ensemble forecasts at scale by leveraging recent
advances in generative artificial intelligence. Our approach learns a
data-driven probabilistic diffusion model from the 5-member ensemble GEFS
reforecast dataset. The model can then be sampled efficiently to produce
realistic weather forecasts, conditioned on a few members of the operational
GEFS forecasting system. The generated ensembles have similar predictive skill
as the full GEFS 31-member ensemble, evaluated against ERA5 reanalysis, and
emulate well the statistics of large physics-based ensembles. We also apply the
same methodology to developing a diffusion model for generative
post-processing: the model directly learns to correct biases present in the
emulated forecasting system by leveraging reanalysis data as labels during
training. Ensembles from this generative post-processing model show greater
reliability and accuracy, particularly in extreme event classification. In
general, they are more reliable and forecast the probability of extreme weather
more accurately than the GEFS operational ensemble. Our models achieve these
results at less than 1/10th of the computational cost incurred by the
operational GEFS system.Summary
AI-Generated Summary