ChatPaper.aiChatPaper

ザ・ウェル:機械学習向けの多様な物理シミュレーションの大規模コレクション

The Well: a Large-Scale Collection of Diverse Physics Simulations for Machine Learning

November 30, 2024
著者: Ruben Ohana, Michael McCabe, Lucas Meyer, Rudy Morel, Fruzsina J. Agocs, Miguel Beneitez, Marsha Berger, Blakesley Burkhart, Stuart B. Dalziel, Drummond B. Fielding, Daniel Fortunato, Jared A. Goldberg, Keiya Hirashima, Yan-Fei Jiang, Rich R. Kerswell, Suryanarayana Maddu, Jonah Miller, Payel Mukhopadhyay, Stefan S. Nixon, Jeff Shen, Romain Watteaux, Bruno Régaldo-Saint Blancard, François Rozet, Liam H. Parker, Miles Cranmer, Shirley Ho
cs.AI

要旨

機械学習ベースの代替モデルは、シミュレーションベースのワークフローを加速するための強力なツールを研究者に提供します。ただし、この領域の標準データセットは物理的振る舞いの小さなクラスをカバーしているため、新しいアプローチの有効性を評価することが難しい場合があります。このギャップを埋めるために、我々はWellを導入します。これは、広範囲の時空間物理システムの数値シミュレーションを含む大規模なデータセットコレクションです。Wellは、生物学システム、流体力学、音響散乱、さらには銀河間流体や超新星爆発の磁気流体力学シミュレーションなど、多様な領域をカバーする16のデータセットを提供するため、専門家や数値ソフトウェア開発者の知見を活用しています。これらのデータセットは個別に使用するか、より広範なベンチマークスイートの一部として使用できます。Wellの利用を容易にするために、モデルのトレーニングと評価のための統一されたPyTorchインタフェースを提供しています。このライブラリの機能を示すために、Wellの複雑なダイナミクスによって引き起こされる新しい課題を強調する例のベースラインを導入します。コードとデータは、https://github.com/PolymathicAI/the_well で入手可能です。
English
Machine learning based surrogate models offer researchers powerful tools for accelerating simulation-based workflows. However, as standard datasets in this space often cover small classes of physical behavior, it can be difficult to evaluate the efficacy of new approaches. To address this gap, we introduce the Well: a large-scale collection of datasets containing numerical simulations of a wide variety of spatiotemporal physical systems. The Well draws from domain experts and numerical software developers to provide 15TB of data across 16 datasets covering diverse domains such as biological systems, fluid dynamics, acoustic scattering, as well as magneto-hydrodynamic simulations of extra-galactic fluids or supernova explosions. These datasets can be used individually or as part of a broader benchmark suite. To facilitate usage of the Well, we provide a unified PyTorch interface for training and evaluating models. We demonstrate the function of this library by introducing example baselines that highlight the new challenges posed by the complex dynamics of the Well. The code and data is available at https://github.com/PolymathicAI/the_well.

Summary

AI-Generated Summary

PDF152December 3, 2024