SEEDS: Emulación de Conjuntos de Pronósticos Meteorológicos con Modelos de Difusión

SEEDS: Emulation of Weather Forecast Ensembles with Diffusion Models

June 24, 2023
Autores: Lizao Li, Rob Carver, Ignacio Lopez-Gomez, Fei Sha, John Anderson
cs.AI

Resumen

La predicción probabilística es crucial para la toma de decisiones bajo incertidumbre sobre el clima futuro. El enfoque predominante es utilizar un conjunto de pronósticos para representar y cuantificar la incertidumbre en la predicción numérica del tiempo operativa. Sin embargo, generar estos conjuntos es computacionalmente costoso. En este artículo, proponemos generar pronósticos de conjunto a gran escala aprovechando los avances recientes en inteligencia artificial generativa. Nuestro enfoque aprende un modelo probabilístico de difusión basado en datos a partir del conjunto de datos de reanálisis GEFS de 5 miembros. Luego, el modelo puede ser muestreado eficientemente para producir pronósticos meteorológicos realistas, condicionados por unos pocos miembros del sistema operativo de pronóstico GEFS. Los conjuntos generados tienen una habilidad predictiva similar al conjunto completo de 31 miembros de GEFS, evaluado frente al reanálisis ERA5, y emulan bien las estadísticas de los grandes conjuntos basados en física. También aplicamos la misma metodología para desarrollar un modelo de difusión para posprocesamiento generativo: el modelo aprende directamente a corregir los sesgos presentes en el sistema de pronóstico emulado utilizando datos de reanálisis como etiquetas durante el entrenamiento. Los conjuntos generados por este modelo de posprocesamiento muestran mayor confiabilidad y precisión, particularmente en la clasificación de eventos extremos. En general, son más confiables y pronostican la probabilidad de clima extremo con mayor precisión que el conjunto operativo de GEFS. Nuestros modelos logran estos resultados con menos de 1/10 del costo computacional incurrido por el sistema operativo GEFS.
English
Probabilistic forecasting is crucial to decision-making under uncertainty about future weather. The dominant approach is to use an ensemble of forecasts to represent and quantify uncertainty in operational numerical weather prediction. However, generating ensembles is computationally costly. In this paper, we propose to generate ensemble forecasts at scale by leveraging recent advances in generative artificial intelligence. Our approach learns a data-driven probabilistic diffusion model from the 5-member ensemble GEFS reforecast dataset. The model can then be sampled efficiently to produce realistic weather forecasts, conditioned on a few members of the operational GEFS forecasting system. The generated ensembles have similar predictive skill as the full GEFS 31-member ensemble, evaluated against ERA5 reanalysis, and emulate well the statistics of large physics-based ensembles. We also apply the same methodology to developing a diffusion model for generative post-processing: the model directly learns to correct biases present in the emulated forecasting system by leveraging reanalysis data as labels during training. Ensembles from this generative post-processing model show greater reliability and accuracy, particularly in extreme event classification. In general, they are more reliable and forecast the probability of extreme weather more accurately than the GEFS operational ensemble. Our models achieve these results at less than 1/10th of the computational cost incurred by the operational GEFS system.

Summary

AI-Generated Summary

PDF10December 15, 2024