SEEDS: Emulación de Conjuntos de Pronósticos Meteorológicos con Modelos de Difusión
SEEDS: Emulation of Weather Forecast Ensembles with Diffusion Models
June 24, 2023
Autores: Lizao Li, Rob Carver, Ignacio Lopez-Gomez, Fei Sha, John Anderson
cs.AI
Resumen
La predicción probabilística es crucial para la toma de decisiones bajo incertidumbre sobre el clima futuro. El enfoque predominante es utilizar un conjunto de pronósticos para representar y cuantificar la incertidumbre en la predicción numérica del tiempo operativa. Sin embargo, generar estos conjuntos es computacionalmente costoso. En este artículo, proponemos generar pronósticos de conjunto a gran escala aprovechando los avances recientes en inteligencia artificial generativa. Nuestro enfoque aprende un modelo probabilístico de difusión basado en datos a partir del conjunto de datos de reanálisis GEFS de 5 miembros. Luego, el modelo puede ser muestreado eficientemente para producir pronósticos meteorológicos realistas, condicionados por unos pocos miembros del sistema operativo de pronóstico GEFS. Los conjuntos generados tienen una habilidad predictiva similar al conjunto completo de 31 miembros de GEFS, evaluado frente al reanálisis ERA5, y emulan bien las estadísticas de los grandes conjuntos basados en física. También aplicamos la misma metodología para desarrollar un modelo de difusión para posprocesamiento generativo: el modelo aprende directamente a corregir los sesgos presentes en el sistema de pronóstico emulado utilizando datos de reanálisis como etiquetas durante el entrenamiento. Los conjuntos generados por este modelo de posprocesamiento muestran mayor confiabilidad y precisión, particularmente en la clasificación de eventos extremos. En general, son más confiables y pronostican la probabilidad de clima extremo con mayor precisión que el conjunto operativo de GEFS. Nuestros modelos logran estos resultados con menos de 1/10 del costo computacional incurrido por el sistema operativo GEFS.
English
Probabilistic forecasting is crucial to decision-making under uncertainty
about future weather. The dominant approach is to use an ensemble of forecasts
to represent and quantify uncertainty in operational numerical weather
prediction. However, generating ensembles is computationally costly. In this
paper, we propose to generate ensemble forecasts at scale by leveraging recent
advances in generative artificial intelligence. Our approach learns a
data-driven probabilistic diffusion model from the 5-member ensemble GEFS
reforecast dataset. The model can then be sampled efficiently to produce
realistic weather forecasts, conditioned on a few members of the operational
GEFS forecasting system. The generated ensembles have similar predictive skill
as the full GEFS 31-member ensemble, evaluated against ERA5 reanalysis, and
emulate well the statistics of large physics-based ensembles. We also apply the
same methodology to developing a diffusion model for generative
post-processing: the model directly learns to correct biases present in the
emulated forecasting system by leveraging reanalysis data as labels during
training. Ensembles from this generative post-processing model show greater
reliability and accuracy, particularly in extreme event classification. In
general, they are more reliable and forecast the probability of extreme weather
more accurately than the GEFS operational ensemble. Our models achieve these
results at less than 1/10th of the computational cost incurred by the
operational GEFS system.Summary
AI-Generated Summary