ChatPaper.aiChatPaper

Avançando Representações de Máquinas Moleculares (Aprendidas) com Gráficos Moleculares Infundidos com Estereoeletrônica.

Advancing Molecular Machine (Learned) Representations with Stereoelectronics-Infused Molecular Graphs

August 8, 2024
Autores: Daniil A. Boiko, Thiago Reschützegger, Benjamin Sanchez-Lengeling, Samuel M. Blau, Gabe Gomes
cs.AI

Resumo

A representação molecular é um elemento fundamental em nossa compreensão do mundo físico. Sua importância varia desde os fundamentos das reações químicas até o design de novas terapias e materiais. Modelos anteriores de aprendizado de máquina molecular têm utilizado cadeias, impressões digitais, características globais e grafos moleculares simples que são representações intrinsecamente esparsas em informação. No entanto, à medida que a complexidade das tarefas de previsão aumenta, a representação molecular precisa codificar informações de alta fidelidade. Este trabalho apresenta uma abordagem inovadora para infundir informações ricas em química quântica em grafos moleculares por meio de efeitos estereoeletrônicos. Mostramos que a adição explícita de interações estereoeletrônicas melhora significativamente o desempenho de modelos de aprendizado de máquina molecular. Além disso, representações infundidas com estereoeletrônica podem ser aprendidas e implementadas com um fluxo de trabalho de rede neural de grafos duplos personalizado, permitindo sua aplicação a qualquer tarefa de aprendizado de máquina molecular subsequente. Por fim, demonstramos que as representações aprendidas permitem uma avaliação estereoeletrônica fácil de sistemas anteriormente intratáveis, como proteínas inteiras, abrindo novos caminhos para o design molecular.
English
Molecular representation is a foundational element in our understanding of the physical world. Its importance ranges from the fundamentals of chemical reactions to the design of new therapies and materials. Previous molecular machine learning models have employed strings, fingerprints, global features, and simple molecular graphs that are inherently information-sparse representations. However, as the complexity of prediction tasks increases, the molecular representation needs to encode higher fidelity information. This work introduces a novel approach to infusing quantum-chemical-rich information into molecular graphs via stereoelectronic effects. We show that the explicit addition of stereoelectronic interactions significantly improves the performance of molecular machine learning models. Furthermore, stereoelectronics-infused representations can be learned and deployed with a tailored double graph neural network workflow, enabling its application to any downstream molecular machine learning task. Finally, we show that the learned representations allow for facile stereoelectronic evaluation of previously intractable systems, such as entire proteins, opening new avenues of molecular design.

Summary

AI-Generated Summary

PDF62November 28, 2024