Modelli linguistici nella scoperta molecolare
Language models in molecular discovery
September 28, 2023
Autori: Nikita Janakarajan, Tim Erdmann, Sarath Swaminathan, Teodoro Laino, Jannis Born
cs.AI
Abstract
Il successo dei modelli linguistici, in particolare delle architetture basate su trasformatori, si è esteso ad altri ambiti, dando vita ai "modelli linguistici scientifici" che operano su piccole molecole, proteine o polimeri. In chimica, i modelli linguistici contribuiscono ad accelerare il ciclo di scoperta delle molecole, come dimostrato dai promettenti risultati recenti nella fase iniziale della scoperta di farmaci. In questo articolo, esaminiamo il ruolo dei modelli linguistici nella scoperta molecolare, sottolineando il loro punto di forza nella progettazione di farmaci de novo, nella previsione delle proprietà e nella chimica delle reazioni. Mettiamo in evidenza preziose risorse software open-source, abbassando così la barriera d'ingresso nel campo della modellazione linguistica scientifica. Infine, delineiamo una visione per il futuro del design molecolare che combina un'interfaccia chatbot con l'accesso a strumenti di chimica computazionale. Il nostro contributo rappresenta una risorsa preziosa per ricercatori, chimici e appassionati di IA interessati a comprendere come i modelli linguistici possano e verranno utilizzati per accelerare la scoperta chimica.
English
The success of language models, especially transformer-based architectures,
has trickled into other domains giving rise to "scientific language models"
that operate on small molecules, proteins or polymers. In chemistry, language
models contribute to accelerating the molecule discovery cycle as evidenced by
promising recent findings in early-stage drug discovery. Here, we review the
role of language models in molecular discovery, underlining their strength in
de novo drug design, property prediction and reaction chemistry. We highlight
valuable open-source software assets thus lowering the entry barrier to the
field of scientific language modeling. Last, we sketch a vision for future
molecular design that combines a chatbot interface with access to computational
chemistry tools. Our contribution serves as a valuable resource for
researchers, chemists, and AI enthusiasts interested in understanding how
language models can and will be used to accelerate chemical discovery.