ChatPaper.aiChatPaper

Продвижение молекулярных машин (обученных) представлений с использованием молекулярных графов, насыщенных стереоэлектроникой.

Advancing Molecular Machine (Learned) Representations with Stereoelectronics-Infused Molecular Graphs

August 8, 2024
Авторы: Daniil A. Boiko, Thiago Reschützegger, Benjamin Sanchez-Lengeling, Samuel M. Blau, Gabe Gomes
cs.AI

Аннотация

Молекулярное представление является основополагающим элементом нашего понимания физического мира. Его важность простирается от основ химических реакций до разработки новых терапий и материалов. Предыдущие модели машинного обучения на молекулах использовали строки, отпечатки, глобальные характеристики и простые молекулярные графы, которые по своей природе являются информационно разреженными представлениями. Однако с увеличением сложности задач прогнозирования молекулярное представление должно кодировать информацию более высокой точности. В данной работе представлен новый подход к внедрению квантово-химической информации в молекулярные графы с помощью стереоэлектронных эффектов. Мы показываем, что явное добавление стереоэлектронных взаимодействий значительно улучшает производительность моделей машинного обучения на молекулах. Более того, представления, обогащенные стереоэлектроникой, могут быть изучены и применены с помощью индивидуального рабочего процесса двойного графового нейронной сети, позволяя их применение к любой последующей задаче машинного обучения на молекулах. Наконец, мы показываем, что изученные представления позволяют легко оценивать стереоэлектронику ранее недоступных систем, таких как целые белки, открывая новые пути для молекулярного дизайна.
English
Molecular representation is a foundational element in our understanding of the physical world. Its importance ranges from the fundamentals of chemical reactions to the design of new therapies and materials. Previous molecular machine learning models have employed strings, fingerprints, global features, and simple molecular graphs that are inherently information-sparse representations. However, as the complexity of prediction tasks increases, the molecular representation needs to encode higher fidelity information. This work introduces a novel approach to infusing quantum-chemical-rich information into molecular graphs via stereoelectronic effects. We show that the explicit addition of stereoelectronic interactions significantly improves the performance of molecular machine learning models. Furthermore, stereoelectronics-infused representations can be learned and deployed with a tailored double graph neural network workflow, enabling its application to any downstream molecular machine learning task. Finally, we show that the learned representations allow for facile stereoelectronic evaluation of previously intractable systems, such as entire proteins, opening new avenues of molecular design.

Summary

AI-Generated Summary

PDF62November 28, 2024