ChatPaper.aiChatPaper

Modèles de langage dans la découverte moléculaire

Language models in molecular discovery

September 28, 2023
papers.authors: Nikita Janakarajan, Tim Erdmann, Sarath Swaminathan, Teodoro Laino, Jannis Born
cs.AI

papers.abstract

Le succès des modèles de langage, en particulier des architectures basées sur les transformateurs, s'est étendu à d'autres domaines, donnant naissance à des "modèles de langage scientifiques" qui opèrent sur des petites molécules, des protéines ou des polymères. En chimie, les modèles de langage contribuent à accélérer le cycle de découverte moléculaire, comme en témoignent les résultats prometteurs récents dans la découverte de médicaments à un stade précoce. Ici, nous passons en revue le rôle des modèles de langage dans la découverte moléculaire, en soulignant leur force dans la conception de novo de médicaments, la prédiction de propriétés et la chimie des réactions. Nous mettons en avant des ressources logicielles open-source précieuses, abaissant ainsi le seuil d'entrée dans le domaine de la modélisation de langage scientifique. Enfin, nous esquissons une vision pour la conception moléculaire future qui combine une interface de chatbot avec un accès à des outils de chimie computationnelle. Notre contribution sert de ressource précieuse pour les chercheurs, les chimistes et les passionnés d'IA intéressés à comprendre comment les modèles de langage peuvent et seront utilisés pour accélérer la découverte chimique.
English
The success of language models, especially transformer-based architectures, has trickled into other domains giving rise to "scientific language models" that operate on small molecules, proteins or polymers. In chemistry, language models contribute to accelerating the molecule discovery cycle as evidenced by promising recent findings in early-stage drug discovery. Here, we review the role of language models in molecular discovery, underlining their strength in de novo drug design, property prediction and reaction chemistry. We highlight valuable open-source software assets thus lowering the entry barrier to the field of scientific language modeling. Last, we sketch a vision for future molecular design that combines a chatbot interface with access to computational chemistry tools. Our contribution serves as a valuable resource for researchers, chemists, and AI enthusiasts interested in understanding how language models can and will be used to accelerate chemical discovery.
PDF100December 15, 2024