ChatPaper.aiChatPaper

Avanzamento delle rappresentazioni molecolari (apprese) delle macchine molecolari con grafi molecolari arricchiti da stereoelettronica

Advancing Molecular Machine (Learned) Representations with Stereoelectronics-Infused Molecular Graphs

August 8, 2024
Autori: Daniil A. Boiko, Thiago Reschützegger, Benjamin Sanchez-Lengeling, Samuel M. Blau, Gabe Gomes
cs.AI

Abstract

La rappresentazione molecolare è un elemento fondamentale per la nostra comprensione del mondo fisico. La sua importanza spazia dai principi delle reazioni chimiche alla progettazione di nuove terapie e materiali. I precedenti modelli di machine learning molecolare hanno utilizzato stringhe, impronte digitali, caratteristiche globali e semplici grafi molecolari, che sono rappresentazioni intrinsecamente povere di informazioni. Tuttavia, con l'aumentare della complessità dei compiti di previsione, la rappresentazione molecolare deve codificare informazioni di maggiore fedeltà. Questo lavoro introduce un approccio innovativo per arricchire i grafi molecolari con informazioni quantochimiche attraverso gli effetti stereoelettronici. Dimostriamo che l'aggiunta esplicita di interazioni stereoelettroniche migliora significativamente le prestazioni dei modelli di machine learning molecolare. Inoltre, le rappresentazioni arricchite di stereoelettronica possono essere apprese e implementate con un flusso di lavoro personalizzato basato su una doppia rete neurale a grafo, consentendo la loro applicazione a qualsiasi compito di machine learning molecolare a valle. Infine, mostriamo che le rappresentazioni apprese permettono una facile valutazione stereoelettronica di sistemi precedentemente intrattabili, come intere proteine, aprendo nuove strade per la progettazione molecolare.
English
Molecular representation is a foundational element in our understanding of the physical world. Its importance ranges from the fundamentals of chemical reactions to the design of new therapies and materials. Previous molecular machine learning models have employed strings, fingerprints, global features, and simple molecular graphs that are inherently information-sparse representations. However, as the complexity of prediction tasks increases, the molecular representation needs to encode higher fidelity information. This work introduces a novel approach to infusing quantum-chemical-rich information into molecular graphs via stereoelectronic effects. We show that the explicit addition of stereoelectronic interactions significantly improves the performance of molecular machine learning models. Furthermore, stereoelectronics-infused representations can be learned and deployed with a tailored double graph neural network workflow, enabling its application to any downstream molecular machine learning task. Finally, we show that the learned representations allow for facile stereoelectronic evaluation of previously intractable systems, such as entire proteins, opening new avenues of molecular design.
PDF62November 28, 2024