ChatPaper.aiChatPaper

Élagage adaptatif pour une robustesse accrue et une réduction de la surcharge computationnelle dans les recherches de points selle accélérées par processus gaussiens

Adaptive Pruning for Increased Robustness and Reduced Computational Overhead in Gaussian Process Accelerated Saddle Point Searches

October 7, 2025
papers.authors: Rohit Goswami, Hannes Jónsson
cs.AI

papers.abstract

La régression par processus gaussien (GP) offre une stratégie pour accélérer la recherche de points selle sur des surfaces d'énergie de haute dimension en réduisant le nombre d'évaluations nécessaires de l'énergie et de ses dérivées par rapport aux coordonnées atomiques. Cependant, la surcharge computationnelle liée à l'optimisation des hyperparamètres peut être importante et rendre l'approche inefficace. Des échecs peuvent également survenir si la recherche s'aventure trop loin dans des régions mal représentées par le modèle GP. Ici, ces défis sont résolus en utilisant des mesures de transport optimal géométriquement adaptées et une stratégie d'élagage active basée sur une somme des distances de Wasserstein-1 pour chaque type d'atome dans un échantillonnage des points les plus éloignés, sélectionnant un sous-ensemble de taille fixe de configurations géométriquement diversifiées pour éviter l'augmentation rapide du coût des mises à jour du GP à mesure que davantage d'observations sont effectuées. La stabilité est renforcée par une métrique invariante par permutation qui fournit un rayon de confiance fiable pour l'arrêt précoce et une pénalité de barrière logarithmique pour la croissance de la variance du signal. Ces modifications algorithmiques motivées physiquement démontrent leur efficacité en réduisant de plus de moitié le temps de calcul moyen sur un ensemble de 238 configurations difficiles issues d'un ensemble de données précédemment publié de réactions chimiques. Avec ces améliorations, l'approche GP est établie comme un algorithme robuste et scalable pour accélérer la recherche de points selle lorsque l'évaluation de l'énergie et des forces atomiques nécessite un effort computationnel significatif.
English
Gaussian process (GP) regression provides a strategy for accelerating saddle point searches on high-dimensional energy surfaces by reducing the number of times the energy and its derivatives with respect to atomic coordinates need to be evaluated. The computational overhead in the hyperparameter optimization can, however, be large and make the approach inefficient. Failures can also occur if the search ventures too far into regions that are not represented well enough by the GP model. Here, these challenges are resolved by using geometry-aware optimal transport measures and an active pruning strategy using a summation over Wasserstein-1 distances for each atom-type in farthest-point sampling, selecting a fixed-size subset of geometrically diverse configurations to avoid rapidly increasing cost of GP updates as more observations are made. Stability is enhanced by permutation-invariant metric that provides a reliable trust radius for early-stopping and a logarithmic barrier penalty for the growth of the signal variance. These physically motivated algorithmic changes prove their efficacy by reducing to less than a half the mean computational time on a set of 238 challenging configurations from a previously published data set of chemical reactions. With these improvements, the GP approach is established as, a robust and scalable algorithm for accelerating saddle point searches when the evaluation of the energy and atomic forces requires significant computational effort.
PDF22October 8, 2025