ガウス過程加速サドル点探索におけるロバスト性向上と計算オーバーヘッド低減のための適応的プルーニング
Adaptive Pruning for Increased Robustness and Reduced Computational Overhead in Gaussian Process Accelerated Saddle Point Searches
October 7, 2025
著者: Rohit Goswami, Hannes Jónsson
cs.AI
要旨
ガウス過程(GP)回帰は、エネルギーとその原子座標に関する微分を評価する回数を減らすことで、高次元エネルギー面上での鞍点探索を加速する戦略を提供します。しかし、ハイパーパラメータ最適化における計算オーバーヘッドが大きくなり、このアプローチが非効率になる場合があります。また、探索がGPモデルで十分に表現されていない領域に深入りすると、失敗が発生することもあります。ここでは、幾何学的に最適な輸送尺度と、最遠点サンプリングにおける各原子タイプのWasserstein-1距離の総和を用いた能動的プルーニング戦略を使用することで、これらの課題を解決します。これにより、GP更新のコストが観測数とともに急速に増加するのを防ぐために、幾何学的に多様な構成の固定サイズサブセットを選択します。安定性は、順列不変なメトリックによって早期停止のための信頼できる信頼半径を提供し、信号分散の増大に対する対数障壁ペナルティを課すことで強化されます。これらの物理的に動機付けられたアルゴリズムの変更は、以前に公開された化学反応のデータセットから得られた238の困難な構成において、平均計算時間を半分以下に削減することでその有効性を証明します。これらの改善により、エネルギーと原子力を評価するのに多大な計算労力を要する場合において、GPアプローチは鞍点探索を加速するための堅牢でスケーラブルなアルゴリズムとして確立されました。
English
Gaussian process (GP) regression provides a strategy for accelerating saddle
point searches on high-dimensional energy surfaces by reducing the number of
times the energy and its derivatives with respect to atomic coordinates need to
be evaluated. The computational overhead in the hyperparameter optimization
can, however, be large and make the approach inefficient. Failures can also
occur if the search ventures too far into regions that are not represented well
enough by the GP model. Here, these challenges are resolved by using
geometry-aware optimal transport measures and an active pruning strategy using
a summation over Wasserstein-1 distances for each atom-type in farthest-point
sampling, selecting a fixed-size subset of geometrically diverse configurations
to avoid rapidly increasing cost of GP updates as more observations are made.
Stability is enhanced by permutation-invariant metric that provides a reliable
trust radius for early-stopping and a logarithmic barrier penalty for the
growth of the signal variance. These physically motivated algorithmic changes
prove their efficacy by reducing to less than a half the mean computational
time on a set of 238 challenging configurations from a previously published
data set of chemical reactions. With these improvements, the GP approach is
established as, a robust and scalable algorithm for accelerating saddle point
searches when the evaluation of the energy and atomic forces requires
significant computational effort.