3D-molecuulgeneratie door voxelroosters te ontruisen
3D molecule generation by denoising voxel grids
June 13, 2023
Auteurs: Pedro O. Pinheiro, Joshua Rackers, Joseph Kleinhenz, Michael Maser, Omar Mahmood, Andrew Martin Watkins, Stephen Ra, Vishnu Sresht, Saeed Saremi
cs.AI
Samenvatting
We stellen een nieuwe score-gebaseerde aanpak voor om 3D-moleculen te genereren die worden weergegeven als atomaire dichtheden op reguliere roosters. Eerst trainen we een denoiserend neuraal netwerk dat leert om te mappen van een gladde verdeling van ruisachtige moleculen naar de verdeling van echte moleculen. Vervolgens volgen we het neurale empirische Bayes-raamwerk [Saremi en Hyvarinen, 2019] en genereren we moleculen in twee stappen: (i) we bemonsteren ruisachtige dichtheidsroosters uit een gladde verdeling via underdamped Langevin Markov chain Monte Carlo, en (ii) we herstellen het ``schone'' molecuul door het ruisachtige rooster te denoizen met een enkele stap. Onze methode, VoxMol, genereert moleculen op een fundamenteel andere manier dan de huidige state of the art (d.w.z., diffusiemodellen toegepast op atoompuntwolken). Het verschilt in termen van de datarepresentatie, het ruismodel, de netwerkarchitectuur en het generatieve modelleeralgoritme. VoxMol behaalt vergelijkbare resultaten met de state of the art bij onvoorwaardelijke 3D-molecuulgeneratie, terwijl het eenvoudiger te trainen en sneller is in het genereren van moleculen.
English
We propose a new score-based approach to generate 3D molecules represented as
atomic densities on regular grids. First, we train a denoising neural network
that learns to map from a smooth distribution of noisy molecules to the
distribution of real molecules. Then, we follow the neural empirical Bayes
framework [Saremi and Hyvarinen, 2019] and generate molecules in two steps: (i)
sample noisy density grids from a smooth distribution via underdamped Langevin
Markov chain Monte Carlo, and (ii) recover the ``clean'' molecule by denoising
the noisy grid with a single step. Our method, VoxMol, generates molecules in a
fundamentally different way than the current state of the art (i.e., diffusion
models applied to atom point clouds). It differs in terms of the data
representation, the noise model, the network architecture and the generative
modeling algorithm. VoxMol achieves comparable results to state of the art on
unconditional 3D molecule generation while being simpler to train and faster to
generate molecules.