Avanzando en Representaciones de Máquinas Moleculares (Aprendidas) con Gráficos Moleculares Infundidos con Estereoelectrónica.
Advancing Molecular Machine (Learned) Representations with Stereoelectronics-Infused Molecular Graphs
August 8, 2024
Autores: Daniil A. Boiko, Thiago Reschützegger, Benjamin Sanchez-Lengeling, Samuel M. Blau, Gabe Gomes
cs.AI
Resumen
La representación molecular es un elemento fundamental en nuestra comprensión del mundo físico. Su importancia abarca desde los fundamentos de las reacciones químicas hasta el diseño de nuevas terapias y materiales. Los modelos previos de aprendizaje automático molecular han empleado cadenas, huellas dactilares, características globales y grafos moleculares simples que son representaciones inherentemente escasas en información. Sin embargo, a medida que la complejidad de las tareas de predicción aumenta, la representación molecular necesita codificar información de mayor fidelidad. Este trabajo introduce un enfoque novedoso para infundir información rica en química cuántica en grafos moleculares a través de efectos estereoelectrónicos. Mostramos que la adición explícita de interacciones estereoelectrónicas mejora significativamente el rendimiento de los modelos de aprendizaje automático molecular. Además, las representaciones infundidas con estereoelectrónica pueden ser aprendidas e implementadas con un flujo de trabajo de red neuronal de doble grafo personalizado, lo que permite su aplicación a cualquier tarea de aprendizaje automático molecular subsecuente. Finalmente, demostramos que las representaciones aprendidas permiten una evaluación estereoelectrónica fácil de sistemas previamente intratables, como proteínas enteras, abriendo nuevos caminos para el diseño molecular.
English
Molecular representation is a foundational element in our understanding of
the physical world. Its importance ranges from the fundamentals of chemical
reactions to the design of new therapies and materials. Previous molecular
machine learning models have employed strings, fingerprints, global features,
and simple molecular graphs that are inherently information-sparse
representations. However, as the complexity of prediction tasks increases, the
molecular representation needs to encode higher fidelity information. This work
introduces a novel approach to infusing quantum-chemical-rich information into
molecular graphs via stereoelectronic effects. We show that the explicit
addition of stereoelectronic interactions significantly improves the
performance of molecular machine learning models. Furthermore,
stereoelectronics-infused representations can be learned and deployed with a
tailored double graph neural network workflow, enabling its application to any
downstream molecular machine learning task. Finally, we show that the learned
representations allow for facile stereoelectronic evaluation of previously
intractable systems, such as entire proteins, opening new avenues of molecular
design.Summary
AI-Generated Summary