Modèles de langage dans la découverte moléculaire
Language models in molecular discovery
September 28, 2023
papers.authors: Nikita Janakarajan, Tim Erdmann, Sarath Swaminathan, Teodoro Laino, Jannis Born
cs.AI
papers.abstract
Le succès des modèles de langage, en particulier des architectures basées sur les transformateurs, s'est étendu à d'autres domaines, donnant naissance à des "modèles de langage scientifiques" qui opèrent sur des petites molécules, des protéines ou des polymères. En chimie, les modèles de langage contribuent à accélérer le cycle de découverte moléculaire, comme en témoignent les résultats prometteurs récents dans la découverte de médicaments à un stade précoce. Ici, nous passons en revue le rôle des modèles de langage dans la découverte moléculaire, en soulignant leur force dans la conception de novo de médicaments, la prédiction de propriétés et la chimie des réactions. Nous mettons en avant des ressources logicielles open-source précieuses, abaissant ainsi le seuil d'entrée dans le domaine de la modélisation de langage scientifique. Enfin, nous esquissons une vision pour la conception moléculaire future qui combine une interface de chatbot avec un accès à des outils de chimie computationnelle. Notre contribution sert de ressource précieuse pour les chercheurs, les chimistes et les passionnés d'IA intéressés à comprendre comment les modèles de langage peuvent et seront utilisés pour accélérer la découverte chimique.
English
The success of language models, especially transformer-based architectures,
has trickled into other domains giving rise to "scientific language models"
that operate on small molecules, proteins or polymers. In chemistry, language
models contribute to accelerating the molecule discovery cycle as evidenced by
promising recent findings in early-stage drug discovery. Here, we review the
role of language models in molecular discovery, underlining their strength in
de novo drug design, property prediction and reaction chemistry. We highlight
valuable open-source software assets thus lowering the entry barrier to the
field of scientific language modeling. Last, we sketch a vision for future
molecular design that combines a chatbot interface with access to computational
chemistry tools. Our contribution serves as a valuable resource for
researchers, chemists, and AI enthusiasts interested in understanding how
language models can and will be used to accelerate chemical discovery.