Adaptives Beschneiden zur Erhöhung der Robustheit und Reduzierung des Rechenaufwands bei Gauß-Prozess-beschleunigten Sattelpunkt-Suchen

papers.abstract

Die Gauß-Prozess-Regression (GP-Regression) bietet eine Strategie zur Beschleunigung der Suche nach Sattelpunkten auf hochdimensionalen Energieflächen, indem die Anzahl der notwendigen Berechnungen der Energie und ihrer Ableitungen bezüglich der atomaren Koordinaten reduziert wird. Der Rechenaufwand für die Hyperparameteroptimierung kann jedoch erheblich sein und den Ansatz ineffizient machen. Fehlschläge können auch auftreten, wenn die Suche zu weit in Regionen vordringt, die durch das GP-Modell nicht ausreichend gut abgebildet sind. Hier werden diese Herausforderungen durch den Einsatz geometrie-bewusster Optimaltransport-Maße und einer aktiven Ausdünnungsstrategie gelöst, die eine Summation über Wasserstein-1-Distanzen für jeden Atomtyp in der Farthest-Point-Sampling-Methode verwendet. Dadurch wird eine feste Teilmenge geometrisch diverser Konfigurationen ausgewählt, um den schnell ansteigenden Aufwand für GP-Aktualisierungen bei zunehmenden Beobachtungen zu vermeiden. Die Stabilität wird durch ein permutationsinvariantes Metrikmaß verbessert, das einen zuverlässigen Vertrauensradius für ein frühzeitiges Stoppen und eine logarithmische Barriere-Strafe für das Wachstum der Signalvarianz bereitstellt. Diese physikalisch motivierten algorithmischen Änderungen erweisen ihre Wirksamkeit, indem sie die mittlere Rechenzeit auf weniger als die Hälfte für eine Menge von 238 anspruchsvollen Konfigurationen aus einem zuvor veröffentlichten Datensatz chemischer Reaktionen reduzieren. Mit diesen Verbesserungen etabliert sich der GP-Ansatz als ein robustes und skalierbares Verfahren zur Beschleunigung der Sattelpunkt-Suche, wenn die Berechnung der Energie und der atomaren Kräfte einen erheblichen Rechenaufwand erfordert.

English

Gaussian process (GP) regression provides a strategy for accelerating saddle point searches on high-dimensional energy surfaces by reducing the number of times the energy and its derivatives with respect to atomic coordinates need to be evaluated. The computational overhead in the hyperparameter optimization can, however, be large and make the approach inefficient. Failures can also occur if the search ventures too far into regions that are not represented well enough by the GP model. Here, these challenges are resolved by using geometry-aware optimal transport measures and an active pruning strategy using a summation over Wasserstein-1 distances for each atom-type in farthest-point sampling, selecting a fixed-size subset of geometrically diverse configurations to avoid rapidly increasing cost of GP updates as more observations are made. Stability is enhanced by permutation-invariant metric that provides a reliable trust radius for early-stopping and a logarithmic barrier penalty for the growth of the signal variance. These physically motivated algorithmic changes prove their efficacy by reducing to less than a half the mean computational time on a set of 238 challenging configurations from a previously published data set of chemical reactions. With these improvements, the GP approach is established as, a robust and scalable algorithm for accelerating saddle point searches when the evaluation of the energy and atomic forces requires significant computational effort.

Adaptives Beschneiden zur Erhöhung der Robustheit und Reduzierung des Rechenaufwands bei Gauß-Prozess-beschleunigten Sattelpunkt-Suchen

Adaptive Pruning for Increased Robustness and Reduced Computational Overhead in Gaussian Process Accelerated Saddle Point Searches

papers.abstract

Support