Nauwkeurige Voorspelling van Ligand-Protein Interactie-Affiniteiten met Fijnafgestelde Kleine Taalmodellen
Accurate Prediction of Ligand-Protein Interaction Affinities with Fine-Tuned Small Language Models
June 27, 2024
Auteurs: Ben Fauber
cs.AI
Samenvatting
We beschrijven de nauwkeurige voorspelling van affiniteiten voor ligand-eiwitinteracties (LPI), ook wel bekend als geneesmiddel-doelwitinteracties (DTI), met behulp van instructie-fijn afgestelde, vooraf getrainde generatieve kleine taalmodellen (SLMs). We behaalden nauwkeurige voorspellingen voor een reeks affiniteitswaarden die geassocieerd zijn met ligand-eiwitinteracties op out-of-sample data in een zero-shot setting. Alleen de SMILES-string van het ligand en de aminozuursequentie van het eiwit werden gebruikt als modelinputs. Onze resultaten tonen een duidelijke verbetering ten opzichte van machine learning (ML) en op vrije-energieperturbatie (FEP+) gebaseerde methoden in het nauwkeurig voorspellen van een reeks ligand-eiwitinteractie-affiniteiten, wat kan worden benut om geneesmiddelontwikkelingscampagnes tegen uitdagende therapeutische doelwitten verder te versnellen.
English
We describe the accurate prediction of ligand-protein interaction (LPI)
affinities, also known as drug-target interactions (DTI), with instruction
fine-tuned pretrained generative small language models (SLMs). We achieved
accurate predictions for a range of affinity values associated with
ligand-protein interactions on out-of-sample data in a zero-shot setting. Only
the SMILES string of the ligand and the amino acid sequence of the protein were
used as the model inputs. Our results demonstrate a clear improvement over
machine learning (ML) and free-energy perturbation (FEP+) based methods in
accurately predicting a range of ligand-protein interaction affinities, which
can be leveraged to further accelerate drug discovery campaigns against
challenging therapeutic targets.