Avançando Representações de Máquinas Moleculares (Aprendidas) com Gráficos Moleculares Infundidos com Estereoeletrônica.
Advancing Molecular Machine (Learned) Representations with Stereoelectronics-Infused Molecular Graphs
August 8, 2024
Autores: Daniil A. Boiko, Thiago Reschützegger, Benjamin Sanchez-Lengeling, Samuel M. Blau, Gabe Gomes
cs.AI
Resumo
A representação molecular é um elemento fundamental em nossa compreensão do mundo físico. Sua importância varia desde os fundamentos das reações químicas até o design de novas terapias e materiais. Modelos anteriores de aprendizado de máquina molecular têm utilizado cadeias, impressões digitais, características globais e grafos moleculares simples que são representações intrinsecamente esparsas em informação. No entanto, à medida que a complexidade das tarefas de previsão aumenta, a representação molecular precisa codificar informações de alta fidelidade. Este trabalho apresenta uma abordagem inovadora para infundir informações ricas em química quântica em grafos moleculares por meio de efeitos estereoeletrônicos. Mostramos que a adição explícita de interações estereoeletrônicas melhora significativamente o desempenho de modelos de aprendizado de máquina molecular. Além disso, representações infundidas com estereoeletrônica podem ser aprendidas e implementadas com um fluxo de trabalho de rede neural de grafos duplos personalizado, permitindo sua aplicação a qualquer tarefa de aprendizado de máquina molecular subsequente. Por fim, demonstramos que as representações aprendidas permitem uma avaliação estereoeletrônica fácil de sistemas anteriormente intratáveis, como proteínas inteiras, abrindo novos caminhos para o design molecular.
English
Molecular representation is a foundational element in our understanding of
the physical world. Its importance ranges from the fundamentals of chemical
reactions to the design of new therapies and materials. Previous molecular
machine learning models have employed strings, fingerprints, global features,
and simple molecular graphs that are inherently information-sparse
representations. However, as the complexity of prediction tasks increases, the
molecular representation needs to encode higher fidelity information. This work
introduces a novel approach to infusing quantum-chemical-rich information into
molecular graphs via stereoelectronic effects. We show that the explicit
addition of stereoelectronic interactions significantly improves the
performance of molecular machine learning models. Furthermore,
stereoelectronics-infused representations can be learned and deployed with a
tailored double graph neural network workflow, enabling its application to any
downstream molecular machine learning task. Finally, we show that the learned
representations allow for facile stereoelectronic evaluation of previously
intractable systems, such as entire proteins, opening new avenues of molecular
design.Summary
AI-Generated Summary