Poda Adaptativa para Mayor Robustez y Reducción de la Carga Computacional en Búsquedas de Puntos de Silla Aceleradas por Procesos Gaussianos
Adaptive Pruning for Increased Robustness and Reduced Computational Overhead in Gaussian Process Accelerated Saddle Point Searches
October 7, 2025
Autores: Rohit Goswami, Hannes Jónsson
cs.AI
Resumen
La regresión de procesos gaussianos (GP, por sus siglas en inglés) ofrece una estrategia para acelerar la búsqueda de puntos de silla en superficies de energía de alta dimensión al reducir el número de veces que es necesario evaluar la energía y sus derivadas respecto a las coordenadas atómicas. Sin embargo, la sobrecarga computacional en la optimización de hiperparámetros puede ser grande y hacer que el enfoque sea ineficiente. También pueden ocurrir fallos si la búsqueda se adentra demasiado en regiones que no están suficientemente representadas por el modelo GP. Aquí, estos desafíos se resuelven utilizando medidas de transporte óptimo conscientes de la geometría y una estrategia de poda activa que emplea una suma sobre las distancias de Wasserstein-1 para cada tipo de átomo en un muestreo de puntos más lejanos, seleccionando un subconjunto de tamaño fijo de configuraciones geométricamente diversas para evitar el aumento rápido del costo de las actualizaciones del GP a medida que se realizan más observaciones. La estabilidad se mejora mediante una métrica invariante a permutaciones que proporciona un radio de confianza confiable para la detención temprana y una penalización de barrera logarítmica para el crecimiento de la varianza de la señal. Estos cambios algorítmicos motivados físicamente demuestran su eficacia al reducir a menos de la mitad el tiempo computacional promedio en un conjunto de 238 configuraciones desafiantes de un conjunto de datos previamente publicado de reacciones químicas. Con estas mejoras, el enfoque GP se establece como un algoritmo robusto y escalable para acelerar la búsqueda de puntos de silla cuando la evaluación de la energía y las fuerzas atómicas requiere un esfuerzo computacional significativo.
English
Gaussian process (GP) regression provides a strategy for accelerating saddle
point searches on high-dimensional energy surfaces by reducing the number of
times the energy and its derivatives with respect to atomic coordinates need to
be evaluated. The computational overhead in the hyperparameter optimization
can, however, be large and make the approach inefficient. Failures can also
occur if the search ventures too far into regions that are not represented well
enough by the GP model. Here, these challenges are resolved by using
geometry-aware optimal transport measures and an active pruning strategy using
a summation over Wasserstein-1 distances for each atom-type in farthest-point
sampling, selecting a fixed-size subset of geometrically diverse configurations
to avoid rapidly increasing cost of GP updates as more observations are made.
Stability is enhanced by permutation-invariant metric that provides a reliable
trust radius for early-stopping and a logarithmic barrier penalty for the
growth of the signal variance. These physically motivated algorithmic changes
prove their efficacy by reducing to less than a half the mean computational
time on a set of 238 challenging configurations from a previously published
data set of chemical reactions. With these improvements, the GP approach is
established as, a robust and scalable algorithm for accelerating saddle point
searches when the evaluation of the energy and atomic forces requires
significant computational effort.