Адаптивное прореживание для повышения устойчивости и снижения вычислительных затрат в поиске седловых точек с использованием ускоренных гауссовских процессов

Аннотация

Гауссовский процесс (GP) регрессии предлагает стратегию для ускорения поиска седловых точек на высокоразмерных энергетических поверхностях, сокращая количество вычислений энергии и её производных по атомным координатам. Однако вычислительные затраты на оптимизацию гиперпараметров могут быть значительными, что делает подход неэффективным. Также могут возникать сбои, если поиск заходит в области, недостаточно хорошо представленные моделью GP. В данной работе эти проблемы решаются с использованием геометрически осознанных мер оптимального транспорта и активной стратегии отбора, основанной на суммировании расстояний Васерштейна-1 для каждого типа атомов при выборке по методу наиболее удалённых точек, что позволяет выбрать фиксированное подмножество геометрически разнообразных конфигураций и избежать быстрого роста затрат на обновление GP по мере добавления новых наблюдений. Устойчивость повышается за счёт перестановочно-инвариантной метрики, которая обеспечивает надёжный радиус доверия для ранней остановки, и логарифмического барьерного штрафа для роста дисперсии сигнала. Эти физически мотивированные изменения алгоритма демонстрируют свою эффективность, сокращая среднее время вычислений более чем вдвое на наборе из 238 сложных конфигураций из ранее опубликованного набора данных химических реакций. С этими улучшениями подход GP становится надёжным и масштабируемым алгоритмом для ускорения поиска седловых точек в случаях, когда вычисление энергии и атомных сил требует значительных вычислительных ресурсов.

English

Gaussian process (GP) regression provides a strategy for accelerating saddle point searches on high-dimensional energy surfaces by reducing the number of times the energy and its derivatives with respect to atomic coordinates need to be evaluated. The computational overhead in the hyperparameter optimization can, however, be large and make the approach inefficient. Failures can also occur if the search ventures too far into regions that are not represented well enough by the GP model. Here, these challenges are resolved by using geometry-aware optimal transport measures and an active pruning strategy using a summation over Wasserstein-1 distances for each atom-type in farthest-point sampling, selecting a fixed-size subset of geometrically diverse configurations to avoid rapidly increasing cost of GP updates as more observations are made. Stability is enhanced by permutation-invariant metric that provides a reliable trust radius for early-stopping and a logarithmic barrier penalty for the growth of the signal variance. These physically motivated algorithmic changes prove their efficacy by reducing to less than a half the mean computational time on a set of 238 challenging configurations from a previously published data set of chemical reactions. With these improvements, the GP approach is established as, a robust and scalable algorithm for accelerating saddle point searches when the evaluation of the energy and atomic forces requires significant computational effort.

Адаптивное прореживание для повышения устойчивости и снижения вычислительных затрат в поиске седловых точек с использованием ускоренных гауссовских процессов

Adaptive Pruning for Increased Robustness and Reduced Computational Overhead in Gaussian Process Accelerated Saddle Point Searches

Аннотация

Support