Modelos de linguagem na descoberta molecular
Language models in molecular discovery
September 28, 2023
Autores: Nikita Janakarajan, Tim Erdmann, Sarath Swaminathan, Teodoro Laino, Jannis Born
cs.AI
Resumo
O sucesso dos modelos de linguagem, especialmente das arquiteturas baseadas em transformers, expandiu-se para outros domínios, dando origem aos "modelos de linguagem científica" que operam em moléculas pequenas, proteínas ou polímeros. Na química, os modelos de linguagem contribuem para acelerar o ciclo de descoberta de moléculas, como evidenciado por descobertas recentes promissoras no estágio inicial da descoberta de fármacos. Aqui, revisamos o papel dos modelos de linguagem na descoberta molecular, destacando sua força no design de novo de fármacos, na previsão de propriedades e na química de reações. Destacamos valiosos recursos de software de código aberto, reduzindo assim a barreira de entrada no campo da modelagem de linguagem científica. Por fim, esboçamos uma visão para o futuro do design molecular que combina uma interface de chatbot com acesso a ferramentas de química computacional. Nossa contribuição serve como um recurso valioso para pesquisadores, químicos e entusiastas de IA interessados em entender como os modelos de linguagem podem e serão usados para acelerar a descoberta química.
English
The success of language models, especially transformer-based architectures,
has trickled into other domains giving rise to "scientific language models"
that operate on small molecules, proteins or polymers. In chemistry, language
models contribute to accelerating the molecule discovery cycle as evidenced by
promising recent findings in early-stage drug discovery. Here, we review the
role of language models in molecular discovery, underlining their strength in
de novo drug design, property prediction and reaction chemistry. We highlight
valuable open-source software assets thus lowering the entry barrier to the
field of scientific language modeling. Last, we sketch a vision for future
molecular design that combines a chatbot interface with access to computational
chemistry tools. Our contribution serves as a valuable resource for
researchers, chemists, and AI enthusiasts interested in understanding how
language models can and will be used to accelerate chemical discovery.