SEEDS: Эмуляция ансамблей прогноза погоды с использованием диффузионных моделей

SEEDS: Emulation of Weather Forecast Ensembles with Diffusion Models

June 24, 2023
Авторы: Lizao Li, Rob Carver, Ignacio Lopez-Gomez, Fei Sha, John Anderson
cs.AI

Аннотация

Вероятностное прогнозирование играет ключевую роль в принятии решений в условиях неопределенности относительно будущей погоды. Основной подход заключается в использовании ансамбля прогнозов для представления и количественной оценки неопределенности в оперативном численном прогнозировании погоды. Однако генерация ансамблей требует значительных вычислительных ресурсов. В данной статье мы предлагаем масштабируемую генерацию ансамблевых прогнозов, используя последние достижения в области генеративного искусственного интеллекта. Наш подход заключается в обучении вероятностной диффузионной модели на основе данных из 5-членного ансамбля GEFS репрогнозов. Затем модель может эффективно использоваться для генерации реалистичных прогнозов погоды, учитывая несколько членов оперативного ансамбля GEFS. Сгенерированные ансамбли демонстрируют схожую прогностическую способность с полным 31-членным ансамблем GEFS при оценке по данным реанализа ERA5 и хорошо воспроизводят статистику крупных физически обоснованных ансамблей. Мы также применяем ту же методологию для разработки диффузионной модели генеративной постобработки: модель напрямую обучается корректировать систематические ошибки, присутствующие в эмулированной системе прогнозирования, используя данные реанализа в качестве меток во время обучения. Ансамбли, полученные с помощью этой модели генеративной постобработки, демонстрируют более высокую надежность и точность, особенно в классификации экстремальных событий. В целом, они более надежны и точнее прогнозируют вероятность экстремальных погодных явлений по сравнению с оперативным ансамблем GEFS. Наши модели достигают этих результатов при менее чем 1/10 вычислительных затрат, требуемых оперативной системой GEFS.
English
Probabilistic forecasting is crucial to decision-making under uncertainty about future weather. The dominant approach is to use an ensemble of forecasts to represent and quantify uncertainty in operational numerical weather prediction. However, generating ensembles is computationally costly. In this paper, we propose to generate ensemble forecasts at scale by leveraging recent advances in generative artificial intelligence. Our approach learns a data-driven probabilistic diffusion model from the 5-member ensemble GEFS reforecast dataset. The model can then be sampled efficiently to produce realistic weather forecasts, conditioned on a few members of the operational GEFS forecasting system. The generated ensembles have similar predictive skill as the full GEFS 31-member ensemble, evaluated against ERA5 reanalysis, and emulate well the statistics of large physics-based ensembles. We also apply the same methodology to developing a diffusion model for generative post-processing: the model directly learns to correct biases present in the emulated forecasting system by leveraging reanalysis data as labels during training. Ensembles from this generative post-processing model show greater reliability and accuracy, particularly in extreme event classification. In general, they are more reliable and forecast the probability of extreme weather more accurately than the GEFS operational ensemble. Our models achieve these results at less than 1/10th of the computational cost incurred by the operational GEFS system.

Summary

AI-Generated Summary

PDF10December 15, 2024