ChatPaper.aiChatPaper

Prithvi WxC: Modello di Base per il Tempo e il Clima

Prithvi WxC: Foundation Model for Weather and Climate

September 20, 2024
Autori: Johannes Schmude, Sujit Roy, Will Trojak, Johannes Jakubik, Daniel Salles Civitarese, Shraddha Singh, Julian Kuehnert, Kumar Ankur, Aman Gupta, Christopher E Phillips, Romeo Kienzler, Daniela Szwarcman, Vishal Gaur, Rajat Shinde, Rohit Lal, Arlindo Da Silva, Jorge Luis Guevara Diaz, Anne Jones, Simon Pfreundschuh, Amy Lin, Aditi Sheshadri, Udaysankar Nair, Valentine Anantharaj, Hendrik Hamann, Campbell Watson, Manil Maskey, Tsengdar J Lee, Juan Bernabe Moreno, Rahul Ramachandran
cs.AI

Abstract

Stimolati dalla consapevolezza che gli emulatori di intelligenza artificiale possono eguagliare le prestazioni dei tradizionali modelli di previsione meteorologica numerica eseguiti su sistemi HPC, ora vi è un numero crescente di grandi modelli di intelligenza artificiale che affrontano casi d'uso come la previsione, il downsampling o il nowcasting. Mentre gli sviluppi paralleli nella letteratura sull'intelligenza artificiale si concentrano sui modelli fondamentali - modelli che possono essere efficacemente regolati per affrontare molteplici casi d'uso diversi - gli sviluppi nel settore meteorologico e climatico si concentrano principalmente su casi d'uso singoli con particolare enfasi sulla previsione a medio termine. Colmiamo questa lacuna presentando Prithvi WxC, un modello fondamentale con 2,3 miliardi di parametri sviluppato utilizzando 160 variabili dalla Modern-Era Retrospective Analysis for Research and Applications, Version 2 (MERRA-2). Prithvi WxC utilizza un'architettura basata su encoder-decoder, incorporando concetti di vari modelli trasformer recenti per catturare efficacemente le dipendenze regionali e globali nei dati di input. Il modello è stato progettato per gestire un gran numero di token per modellare i fenomeni meteorologici in diverse topologie a risoluzioni dettagliate. Inoltre, è stato addestrato con un obiettivo misto che combina i paradigmi della ricostruzione mascherata con la previsione. Testiamo il modello su un insieme di impegnative attività downstream, ovvero: previsione di rollout autoregressiva, downsampling, parametrizzazione del flusso di onde gravitazionali ed estimazione degli eventi estremi. Il modello preaddestrato con 2,3 miliardi di parametri, insieme ai relativi flussi di lavoro di fine-tuning, è stato rilasciato pubblicamente come contributo open-source tramite Hugging Face.
English
Triggered by the realization that AI emulators can rival the performance of traditional numerical weather prediction models running on HPC systems, there is now an increasing number of large AI models that address use cases such as forecasting, downscaling, or nowcasting. While the parallel developments in the AI literature focus on foundation models -- models that can be effectively tuned to address multiple, different use cases -- the developments on the weather and climate side largely focus on single-use cases with particular emphasis on mid-range forecasting. We close this gap by introducing Prithvi WxC, a 2.3 billion parameter foundation model developed using 160 variables from the Modern-Era Retrospective Analysis for Research and Applications, Version 2 (MERRA-2). Prithvi WxC employs an encoder-decoder-based architecture, incorporating concepts from various recent transformer models to effectively capture both regional and global dependencies in the input data. The model has been designed to accommodate large token counts to model weather phenomena in different topologies at fine resolutions. Furthermore, it is trained with a mixed objective that combines the paradigms of masked reconstruction with forecasting. We test the model on a set of challenging downstream tasks namely: Autoregressive rollout forecasting, Downscaling, Gravity wave flux parameterization, and Extreme events estimation. The pretrained model with 2.3 billion parameters, along with the associated fine-tuning workflows, has been publicly released as an open-source contribution via Hugging Face.

Summary

AI-Generated Summary

PDF434November 16, 2024