Adaptives Beschneiden zur Erhöhung der Robustheit und Reduzierung des Rechenaufwands bei Gauß-Prozess-beschleunigten Sattelpunkt-Suchen
Adaptive Pruning for Increased Robustness and Reduced Computational Overhead in Gaussian Process Accelerated Saddle Point Searches
October 7, 2025
papers.authors: Rohit Goswami, Hannes Jónsson
cs.AI
papers.abstract
Die Gauß-Prozess-Regression (GP-Regression) bietet eine Strategie zur Beschleunigung der Suche nach Sattelpunkten auf hochdimensionalen Energieflächen, indem die Anzahl der notwendigen Berechnungen der Energie und ihrer Ableitungen bezüglich der atomaren Koordinaten reduziert wird. Der Rechenaufwand für die Hyperparameteroptimierung kann jedoch erheblich sein und den Ansatz ineffizient machen. Fehlschläge können auch auftreten, wenn die Suche zu weit in Regionen vordringt, die durch das GP-Modell nicht ausreichend gut abgebildet sind. Hier werden diese Herausforderungen durch den Einsatz geometrie-bewusster Optimaltransport-Maße und einer aktiven Ausdünnungsstrategie gelöst, die eine Summation über Wasserstein-1-Distanzen für jeden Atomtyp in der Farthest-Point-Sampling-Methode verwendet. Dadurch wird eine feste Teilmenge geometrisch diverser Konfigurationen ausgewählt, um den schnell ansteigenden Aufwand für GP-Aktualisierungen bei zunehmenden Beobachtungen zu vermeiden. Die Stabilität wird durch ein permutationsinvariantes Metrikmaß verbessert, das einen zuverlässigen Vertrauensradius für ein frühzeitiges Stoppen und eine logarithmische Barriere-Strafe für das Wachstum der Signalvarianz bereitstellt. Diese physikalisch motivierten algorithmischen Änderungen erweisen ihre Wirksamkeit, indem sie die mittlere Rechenzeit auf weniger als die Hälfte für eine Menge von 238 anspruchsvollen Konfigurationen aus einem zuvor veröffentlichten Datensatz chemischer Reaktionen reduzieren. Mit diesen Verbesserungen etabliert sich der GP-Ansatz als ein robustes und skalierbares Verfahren zur Beschleunigung der Sattelpunkt-Suche, wenn die Berechnung der Energie und der atomaren Kräfte einen erheblichen Rechenaufwand erfordert.
English
Gaussian process (GP) regression provides a strategy for accelerating saddle
point searches on high-dimensional energy surfaces by reducing the number of
times the energy and its derivatives with respect to atomic coordinates need to
be evaluated. The computational overhead in the hyperparameter optimization
can, however, be large and make the approach inefficient. Failures can also
occur if the search ventures too far into regions that are not represented well
enough by the GP model. Here, these challenges are resolved by using
geometry-aware optimal transport measures and an active pruning strategy using
a summation over Wasserstein-1 distances for each atom-type in farthest-point
sampling, selecting a fixed-size subset of geometrically diverse configurations
to avoid rapidly increasing cost of GP updates as more observations are made.
Stability is enhanced by permutation-invariant metric that provides a reliable
trust radius for early-stopping and a logarithmic barrier penalty for the
growth of the signal variance. These physically motivated algorithmic changes
prove their efficacy by reducing to less than a half the mean computational
time on a set of 238 challenging configurations from a previously published
data set of chemical reactions. With these improvements, the GP approach is
established as, a robust and scalable algorithm for accelerating saddle point
searches when the evaluation of the energy and atomic forces requires
significant computational effort.