ChatPaper.aiChatPaper

Adaptief Snoeien voor Verhoogde Robuustheid en Verminderde Rekenkundige Overhead in Gaussische Proces Versnelde Zadelpunt Zoektochten

Adaptive Pruning for Increased Robustness and Reduced Computational Overhead in Gaussian Process Accelerated Saddle Point Searches

October 7, 2025
Auteurs: Rohit Goswami, Hannes Jónsson
cs.AI

Samenvatting

Gaussiaans proces (GP) regressie biedt een strategie om het zoeken naar zadelpunten op hoogdimensionale energieoppervlakken te versnellen door het aantal keren dat de energie en zijn afgeleiden ten opzichte van atoomcoördinaten moeten worden geëvalueerd te verminderen. De rekenkundige overhead bij de optimalisatie van hyperparameters kan echter groot zijn en de aanpak inefficiënt maken. Fouten kunnen ook optreden als de zoektocht te ver afdwaalt naar regio's die niet goed genoeg worden weergegeven door het GP-model. Hier worden deze uitdagingen opgelost door gebruik te maken van geometrie-bewuste optimale transportmaten en een actieve snoeistrategie die een sommatie van Wasserstein-1 afstanden voor elk atoomtype gebruikt in farthest-point sampling, waarbij een vaste subset van geometrisch diverse configuraties wordt geselecteerd om de snel toenemende kosten van GP-updates te vermijden naarmate meer observaties worden gedaan. De stabiliteit wordt verbeterd door een permutatie-invariante metriek die een betrouwbare vertrouwensradius biedt voor vroegtijdig stoppen en een logaritmische barrière-straf voor de groei van de signaalvariantie. Deze fysiek gemotiveerde algoritmische veranderingen bewijzen hun effectiviteit door de gemiddelde rekentijd te reduceren tot minder dan de helft op een set van 238 uitdagende configuraties uit een eerder gepubliceerde dataset van chemische reacties. Met deze verbeteringen wordt de GP-aanpak gevestigd als een robuust en schaalbaar algoritme voor het versnellen van zadelpuntzoektochten wanneer de evaluatie van de energie en atomaire krachten aanzienlijke rekenkundige inspanning vereist.
English
Gaussian process (GP) regression provides a strategy for accelerating saddle point searches on high-dimensional energy surfaces by reducing the number of times the energy and its derivatives with respect to atomic coordinates need to be evaluated. The computational overhead in the hyperparameter optimization can, however, be large and make the approach inefficient. Failures can also occur if the search ventures too far into regions that are not represented well enough by the GP model. Here, these challenges are resolved by using geometry-aware optimal transport measures and an active pruning strategy using a summation over Wasserstein-1 distances for each atom-type in farthest-point sampling, selecting a fixed-size subset of geometrically diverse configurations to avoid rapidly increasing cost of GP updates as more observations are made. Stability is enhanced by permutation-invariant metric that provides a reliable trust radius for early-stopping and a logarithmic barrier penalty for the growth of the signal variance. These physically motivated algorithmic changes prove their efficacy by reducing to less than a half the mean computational time on a set of 238 challenging configurations from a previously published data set of chemical reactions. With these improvements, the GP approach is established as, a robust and scalable algorithm for accelerating saddle point searches when the evaluation of the energy and atomic forces requires significant computational effort.
PDF22October 8, 2025