ChatPaper.aiChatPaper

Fortschrittliche molekulare Maschinen (erlernte) Repräsentationen mit stereoelektronikdurchtränkten molekularen Graphen

Advancing Molecular Machine (Learned) Representations with Stereoelectronics-Infused Molecular Graphs

August 8, 2024
Autoren: Daniil A. Boiko, Thiago Reschützegger, Benjamin Sanchez-Lengeling, Samuel M. Blau, Gabe Gomes
cs.AI

Zusammenfassung

Die molekulare Darstellung ist ein grundlegendes Element unseres Verständnisses der physikalischen Welt. Ihre Bedeutung reicht von den Grundlagen chemischer Reaktionen bis hin zur Gestaltung neuer Therapien und Materialien. Frühere maschinelle Lernmodelle für Moleküle haben Zeichenfolgen, Fingerabdrücke, globale Merkmale und einfache molekulare Graphen verwendet, die von Natur aus informationsarme Darstellungen sind. Mit zunehmender Komplexität von Vorhersageaufgaben muss die molekulare Darstellung jedoch hochwertigere Informationen kodieren. Diese Arbeit stellt einen neuartigen Ansatz vor, um quantenchemisch reiche Informationen über stereoelektronische Effekte in molekulare Graphen einzubringen. Wir zeigen, dass die explizite Hinzufügung stereoelektronischer Interaktionen die Leistung von maschinellen Lernmodellen für Moleküle signifikant verbessert. Darüber hinaus können stereoelektronik-infundierte Darstellungen mit einem maßgeschneiderten doppelten Graph-Neuronen-Netzwerk-Workflow erlernt und eingesetzt werden, was ihre Anwendung auf jede nachgelagerte maschinelle Lernaufgabe für Moleküle ermöglicht. Schließlich zeigen wir, dass die erlernten Darstellungen eine einfache stereoelektronische Bewertung zuvor unzugänglicher Systeme ermöglichen, wie z. B. ganzer Proteine, und somit neue Wege für die molekulare Gestaltung eröffnen.
English
Molecular representation is a foundational element in our understanding of the physical world. Its importance ranges from the fundamentals of chemical reactions to the design of new therapies and materials. Previous molecular machine learning models have employed strings, fingerprints, global features, and simple molecular graphs that are inherently information-sparse representations. However, as the complexity of prediction tasks increases, the molecular representation needs to encode higher fidelity information. This work introduces a novel approach to infusing quantum-chemical-rich information into molecular graphs via stereoelectronic effects. We show that the explicit addition of stereoelectronic interactions significantly improves the performance of molecular machine learning models. Furthermore, stereoelectronics-infused representations can be learned and deployed with a tailored double graph neural network workflow, enabling its application to any downstream molecular machine learning task. Finally, we show that the learned representations allow for facile stereoelectronic evaluation of previously intractable systems, such as entire proteins, opening new avenues of molecular design.

Summary

AI-Generated Summary

PDF62November 28, 2024