3D-Molekülgenerierung durch Entrauschen von Voxelgittern
3D molecule generation by denoising voxel grids
June 13, 2023
Autoren: Pedro O. Pinheiro, Joshua Rackers, Joseph Kleinhenz, Michael Maser, Omar Mahmood, Andrew Martin Watkins, Stephen Ra, Vishnu Sresht, Saeed Saremi
cs.AI
Zusammenfassung
Wir schlagen einen neuen score-basierten Ansatz vor, um 3D-Moleküle zu generieren, die als atomare Dichten auf regelmäßigen Gittern dargestellt werden. Zunächst trainieren wir ein denoisendes neuronales Netzwerk, das lernt, von einer glatten Verteilung verrauschter Moleküle zur Verteilung echter Moleküle abzubilden. Anschließend folgen wir dem neuralen empirischen Bayes-Rahmen [Saremi und Hyvarinen, 2019] und generieren Moleküle in zwei Schritten: (i) Ziehen von verrauschten Dichtegittern aus einer glatten Verteilung mittels untergedämpfter Langevin-Markov-Ketten-Monte-Carlo-Methode und (ii) Wiederherstellung des „sauberen“ Moleküls durch Entrauschen des verrauschten Gitters in einem einzigen Schritt. Unser Verfahren, VoxMol, generiert Moleküle auf eine grundlegend andere Weise als der aktuelle Stand der Technik (d.h. Diffusionsmodelle, die auf Atompunktwolken angewendet werden). Es unterscheidet sich in Bezug auf die Datenrepräsentation, das Rauschmodell, die Netzwerkarchitektur und den generativen Modellierungsalgorithmus. VoxMol erzielt vergleichbare Ergebnisse wie der Stand der Technik bei der unbedingten 3D-Molekülgenerierung, ist jedoch einfacher zu trainieren und schneller in der Molekülgenerierung.
English
We propose a new score-based approach to generate 3D molecules represented as
atomic densities on regular grids. First, we train a denoising neural network
that learns to map from a smooth distribution of noisy molecules to the
distribution of real molecules. Then, we follow the neural empirical Bayes
framework [Saremi and Hyvarinen, 2019] and generate molecules in two steps: (i)
sample noisy density grids from a smooth distribution via underdamped Langevin
Markov chain Monte Carlo, and (ii) recover the ``clean'' molecule by denoising
the noisy grid with a single step. Our method, VoxMol, generates molecules in a
fundamentally different way than the current state of the art (i.e., diffusion
models applied to atom point clouds). It differs in terms of the data
representation, the noise model, the network architecture and the generative
modeling algorithm. VoxMol achieves comparable results to state of the art on
unconditional 3D molecule generation while being simpler to train and faster to
generate molecules.