ChatPaper.aiChatPaper

Het Bevorderen van Moleculaire Machine (Geleerde) Representaties met Stereoelectronica-Gefuseerde Moleculaire Grafieken

Advancing Molecular Machine (Learned) Representations with Stereoelectronics-Infused Molecular Graphs

August 8, 2024
Auteurs: Daniil A. Boiko, Thiago Reschützegger, Benjamin Sanchez-Lengeling, Samuel M. Blau, Gabe Gomes
cs.AI

Samenvatting

Moleculaire representatie is een fundamenteel element in ons begrip van de fysieke wereld. Het belang ervan strekt zich uit van de basisprincipes van chemische reacties tot het ontwerpen van nieuwe therapieën en materialen. Eerdere moleculaire machine learning-modellen hebben gebruikgemaakt van strings, vingerafdrukken, globale kenmerken en eenvoudige moleculaire grafieken die inherent informatie-arme representaties zijn. Naarmate de complexiteit van voorspellingstaken toeneemt, moet de moleculaire representatie echter informatie van hogere kwaliteit coderen. Dit werk introduceert een nieuwe benadering om kwantumchemisch rijke informatie in moleculaire grafieken te integreren via stereoelectronische effecten. We tonen aan dat de expliciete toevoeging van stereoelectronische interacties de prestaties van moleculaire machine learning-modellen aanzienlijk verbetert. Bovendien kunnen stereoelectronisch verrijkte representaties worden geleerd en ingezet met een op maat gemaakt dubbel grafisch neuraal netwerk-werkproces, waardoor de toepassing ervan op elke downstream moleculaire machine learning-taak mogelijk wordt. Tot slot laten we zien dat de geleerde representaties een eenvoudige stereoelectronische evaluatie van voorheen onbehandelbare systemen, zoals volledige eiwitten, mogelijk maken, wat nieuwe wegen opent voor moleculair ontwerp.
English
Molecular representation is a foundational element in our understanding of the physical world. Its importance ranges from the fundamentals of chemical reactions to the design of new therapies and materials. Previous molecular machine learning models have employed strings, fingerprints, global features, and simple molecular graphs that are inherently information-sparse representations. However, as the complexity of prediction tasks increases, the molecular representation needs to encode higher fidelity information. This work introduces a novel approach to infusing quantum-chemical-rich information into molecular graphs via stereoelectronic effects. We show that the explicit addition of stereoelectronic interactions significantly improves the performance of molecular machine learning models. Furthermore, stereoelectronics-infused representations can be learned and deployed with a tailored double graph neural network workflow, enabling its application to any downstream molecular machine learning task. Finally, we show that the learned representations allow for facile stereoelectronic evaluation of previously intractable systems, such as entire proteins, opening new avenues of molecular design.
PDF62November 28, 2024