ChatPaper.aiChatPaper

Potatura Adattativa per Aumentare la Robustezza e Ridurre il Sovraccarico Computazionale nelle Ricerche di Punti di Sella Accelerate da Processi Gaussiani

Adaptive Pruning for Increased Robustness and Reduced Computational Overhead in Gaussian Process Accelerated Saddle Point Searches

October 7, 2025
Autori: Rohit Goswami, Hannes Jónsson
cs.AI

Abstract

La regressione con processi gaussiani (GP) offre una strategia per accelerare la ricerca di punti di sella su superfici energetiche ad alta dimensionalità riducendo il numero di volte in cui è necessario valutare l'energia e le sue derivate rispetto alle coordinate atomiche. Tuttavia, il sovraccarico computazionale nell'ottimizzazione degli iperparametri può essere significativo e rendere l'approccio inefficiente. Possono inoltre verificarsi fallimenti se la ricerca si spinge troppo lontano in regioni non rappresentate adeguatamente dal modello GP. Qui, queste sfide vengono risolte utilizzando misure di trasporto ottimale sensibili alla geometria e una strategia di potatura attiva basata su una somma delle distanze di Wasserstein-1 per ogni tipo di atomo nel campionamento a punti più lontani, selezionando un sottoinsieme di dimensioni fisse di configurazioni geometricamente diversificate per evitare l'aumento rapido del costo degli aggiornamenti GP man mano che vengono effettuate più osservazioni. La stabilità è migliorata da una metrica invariante rispetto alle permutazioni che fornisce un raggio di fiducia affidabile per l'arresto anticipato e da una penalità di barriera logaritmica per la crescita della varianza del segnale. Queste modifiche algoritmiche motivate fisicamente dimostrano la loro efficacia riducendo a meno della metà il tempo computazionale medio su un insieme di 238 configurazioni complesse provenienti da un set di dati precedentemente pubblicato di reazioni chimiche. Con questi miglioramenti, l'approccio GP si afferma come un algoritmo robusto e scalabile per accelerare la ricerca di punti di sella quando la valutazione dell'energia e delle forze atomiche richiede uno sforzo computazionale significativo.
English
Gaussian process (GP) regression provides a strategy for accelerating saddle point searches on high-dimensional energy surfaces by reducing the number of times the energy and its derivatives with respect to atomic coordinates need to be evaluated. The computational overhead in the hyperparameter optimization can, however, be large and make the approach inefficient. Failures can also occur if the search ventures too far into regions that are not represented well enough by the GP model. Here, these challenges are resolved by using geometry-aware optimal transport measures and an active pruning strategy using a summation over Wasserstein-1 distances for each atom-type in farthest-point sampling, selecting a fixed-size subset of geometrically diverse configurations to avoid rapidly increasing cost of GP updates as more observations are made. Stability is enhanced by permutation-invariant metric that provides a reliable trust radius for early-stopping and a logarithmic barrier penalty for the growth of the signal variance. These physically motivated algorithmic changes prove their efficacy by reducing to less than a half the mean computational time on a set of 238 challenging configurations from a previously published data set of chemical reactions. With these improvements, the GP approach is established as, a robust and scalable algorithm for accelerating saddle point searches when the evaluation of the energy and atomic forces requires significant computational effort.
PDF22October 8, 2025