ChatPaper.aiChatPaper

Progrès dans les représentations moléculaires (apprises) des machines moléculaires avec des graphes moléculaires enrichis par la stéréoélectronique

Advancing Molecular Machine (Learned) Representations with Stereoelectronics-Infused Molecular Graphs

August 8, 2024
Auteurs: Daniil A. Boiko, Thiago Reschützegger, Benjamin Sanchez-Lengeling, Samuel M. Blau, Gabe Gomes
cs.AI

Résumé

La représentation moléculaire constitue un élément fondamental dans notre compréhension du monde physique. Son importance s'étend des principes de base des réactions chimiques à la conception de nouvelles thérapies et matériaux. Les modèles précédents d'apprentissage automatique moléculaire ont utilisé des chaînes de caractères, des empreintes moléculaires, des caractéristiques globales et des graphes moléculaires simples, qui sont par nature des représentations pauvres en informations. Cependant, à mesure que la complexité des tâches de prédiction augmente, la représentation moléculaire doit encoder des informations de plus haute fidélité. Ce travail introduit une nouvelle approche pour intégrer des informations riches en chimie quantique dans les graphes moléculaires via les effets stéréoélectroniques. Nous montrons que l'ajout explicite d'interactions stéréoélectroniques améliore significativement les performances des modèles d'apprentissage automatique moléculaire. De plus, les représentations enrichies en stéréoélectronique peuvent être apprises et déployées grâce à un flux de travail sur mesure utilisant un double réseau de neurones graphiques, permettant leur application à toute tâche d'apprentissage automatique moléculaire en aval. Enfin, nous montrons que les représentations apprises permettent une évaluation stéréoélectronique aisée de systèmes auparavant inaccessibles, comme des protéines entières, ouvrant ainsi de nouvelles voies dans la conception moléculaire.
English
Molecular representation is a foundational element in our understanding of the physical world. Its importance ranges from the fundamentals of chemical reactions to the design of new therapies and materials. Previous molecular machine learning models have employed strings, fingerprints, global features, and simple molecular graphs that are inherently information-sparse representations. However, as the complexity of prediction tasks increases, the molecular representation needs to encode higher fidelity information. This work introduces a novel approach to infusing quantum-chemical-rich information into molecular graphs via stereoelectronic effects. We show that the explicit addition of stereoelectronic interactions significantly improves the performance of molecular machine learning models. Furthermore, stereoelectronics-infused representations can be learned and deployed with a tailored double graph neural network workflow, enabling its application to any downstream molecular machine learning task. Finally, we show that the learned representations allow for facile stereoelectronic evaluation of previously intractable systems, such as entire proteins, opening new avenues of molecular design.

Summary

AI-Generated Summary

PDF62November 28, 2024