Génération de molécules 3D par débruitage de grilles voxel
3D molecule generation by denoising voxel grids
June 13, 2023
Auteurs: Pedro O. Pinheiro, Joshua Rackers, Joseph Kleinhenz, Michael Maser, Omar Mahmood, Andrew Martin Watkins, Stephen Ra, Vishnu Sresht, Saeed Saremi
cs.AI
Résumé
Nous proposons une nouvelle approche basée sur les scores pour générer des molécules 3D représentées sous forme de densités atomiques sur des grilles régulières. Tout d'abord, nous entraînons un réseau de neurones de débruitage qui apprend à mapper une distribution lissée de molécules bruitées vers la distribution de molécules réelles. Ensuite, nous suivons le cadre de l'inférence bayésienne empirique neuronale [Saremi et Hyvarinen, 2019] et générons les molécules en deux étapes : (i) échantillonner des grilles de densité bruitées à partir d'une distribution lissée via une chaîne de Markov Monte Carlo de Langevin sous-amortie, et (ii) récupérer la molécule « propre » en débruitant la grille bruitée en une seule étape. Notre méthode, VoxMol, génère des molécules d'une manière fondamentalement différente de l'état de l'art actuel (c'est-à-dire les modèles de diffusion appliqués aux nuages de points atomiques). Elle diffère en termes de représentation des données, de modèle de bruit, d'architecture de réseau et d'algorithme de modélisation générative. VoxMol obtient des résultats comparables à l'état de l'art pour la génération inconditionnelle de molécules 3D, tout en étant plus simple à entraîner et plus rapide pour générer des molécules.
English
We propose a new score-based approach to generate 3D molecules represented as
atomic densities on regular grids. First, we train a denoising neural network
that learns to map from a smooth distribution of noisy molecules to the
distribution of real molecules. Then, we follow the neural empirical Bayes
framework [Saremi and Hyvarinen, 2019] and generate molecules in two steps: (i)
sample noisy density grids from a smooth distribution via underdamped Langevin
Markov chain Monte Carlo, and (ii) recover the ``clean'' molecule by denoising
the noisy grid with a single step. Our method, VoxMol, generates molecules in a
fundamentally different way than the current state of the art (i.e., diffusion
models applied to atom point clouds). It differs in terms of the data
representation, the noise model, the network architecture and the generative
modeling algorithm. VoxMol achieves comparable results to state of the art on
unconditional 3D molecule generation while being simpler to train and faster to
generate molecules.