Генерация 3D-молекул путем удаления шума из воксельных сеток
3D molecule generation by denoising voxel grids
June 13, 2023
Авторы: Pedro O. Pinheiro, Joshua Rackers, Joseph Kleinhenz, Michael Maser, Omar Mahmood, Andrew Martin Watkins, Stephen Ra, Vishnu Sresht, Saeed Saremi
cs.AI
Аннотация
Мы предлагаем новый подход на основе оценок для генерации 3D-молекул, представленных в виде атомных плотностей на регулярных сетках. Сначала мы обучаем нейронную сеть для удаления шума, которая учится отображать сглаженное распределение зашумленных молекул в распределение реальных молекул. Затем, следуя нейроэмпирическому байесовскому подходу [Saremi и Hyvarinen, 2019], мы генерируем молекулы в два этапа: (i) выборка зашумленных сеток плотностей из сглаженного распределения с использованием метода Монте-Карло с цепью Маркова в условиях недостаточного демпфирования (underdamped Langevin), и (ii) восстановление «чистой» молекулы путем удаления шума с сетки за один шаг. Наш метод, VoxMol, генерирует молекулы принципиально иначе, чем современные подходы (например, диффузионные модели, применяемые к облакам атомных точек). Он отличается в терминах представления данных, модели шума, архитектуры сети и алгоритма генеративного моделирования. VoxMol демонстрирует результаты, сопоставимые с современными методами в задаче безусловной генерации 3D-молекул, при этом проще в обучении и быстрее в генерации молекул.
English
We propose a new score-based approach to generate 3D molecules represented as
atomic densities on regular grids. First, we train a denoising neural network
that learns to map from a smooth distribution of noisy molecules to the
distribution of real molecules. Then, we follow the neural empirical Bayes
framework [Saremi and Hyvarinen, 2019] and generate molecules in two steps: (i)
sample noisy density grids from a smooth distribution via underdamped Langevin
Markov chain Monte Carlo, and (ii) recover the ``clean'' molecule by denoising
the noisy grid with a single step. Our method, VoxMol, generates molecules in a
fundamentally different way than the current state of the art (i.e., diffusion
models applied to atom point clouds). It differs in terms of the data
representation, the noise model, the network architecture and the generative
modeling algorithm. VoxMol achieves comparable results to state of the art on
unconditional 3D molecule generation while being simpler to train and faster to
generate molecules.