Taalmodellen in moleculaire ontdekking
Language models in molecular discovery
September 28, 2023
Auteurs: Nikita Janakarajan, Tim Erdmann, Sarath Swaminathan, Teodoro Laino, Jannis Born
cs.AI
Samenvatting
Het succes van taalmodelen, met name transformer-gebaseerde architecturen, heeft zich uitgebreid naar andere domeinen, wat heeft geleid tot "wetenschappelijke taalmodelen" die werken op kleine moleculen, eiwitten of polymeren. In de chemie dragen taalmodelen bij aan het versnellen van de molecuulontdekkingscyclus, zoals blijkt uit veelbelovende recente bevindingen in de vroege fase van medicijnontwikkeling. Hier bespreken we de rol van taalmodelen in moleculaire ontdekking, waarbij we hun kracht benadrukken in de novo geneesmiddelontwerp, eigenschapsvoorspelling en reactiechemie. We belichten waardevolle open-source softwaretools, waardoor de drempel om het veld van wetenschappelijk taalmodeleren te betreden wordt verlaagd. Totalschetsen we een visie voor toekomstig moleculair ontwerp dat een chatbot-interface combineert met toegang tot computationele chemietools. Onze bijdrage dient als een waardevolle bron voor onderzoekers, chemici en AI-enthousiastelingen die geïnteresseerd zijn in het begrijpen van hoe taalmodelen kunnen en zullen worden gebruikt om chemische ontdekkingen te versnellen.
English
The success of language models, especially transformer-based architectures,
has trickled into other domains giving rise to "scientific language models"
that operate on small molecules, proteins or polymers. In chemistry, language
models contribute to accelerating the molecule discovery cycle as evidenced by
promising recent findings in early-stage drug discovery. Here, we review the
role of language models in molecular discovery, underlining their strength in
de novo drug design, property prediction and reaction chemistry. We highlight
valuable open-source software assets thus lowering the entry barrier to the
field of scientific language modeling. Last, we sketch a vision for future
molecular design that combines a chatbot interface with access to computational
chemistry tools. Our contribution serves as a valuable resource for
researchers, chemists, and AI enthusiasts interested in understanding how
language models can and will be used to accelerate chemical discovery.