Präzise Vorhersage von Ligand-Protein-Interaktionsaffinitäten mit feinabgestimmten kleinen Sprachmodellen
Accurate Prediction of Ligand-Protein Interaction Affinities with Fine-Tuned Small Language Models
June 27, 2024
Autoren: Ben Fauber
cs.AI
Zusammenfassung
Wir beschreiben die präzise Vorhersage von Ligand-Protein-Interaktionsaffinitäten, auch bekannt als Wirkstoff-Ziel-Interaktionen, unter Verwendung von feinabgestimmten vorab trainierten generativen kleinen Sprachmodellen (SLMs). Wir erzielten präzise Vorhersagen für eine Reihe von Affinitätswerten, die mit Ligand-Protein-Interaktionen in Out-of-Sample-Daten in einem Zero-Shot-Setting verbunden sind. Nur der SMILES-String des Liganden und die Aminosäuresequenz des Proteins wurden als Modellinputs verwendet. Unsere Ergebnisse zeigen eine klare Verbesserung gegenüber maschinellem Lernen (ML) und Methoden auf Basis von freier Energieperturbation (FEP+), um eine Reihe von Ligand-Protein-Interaktionsaffinitäten präzise vorherzusagen, was genutzt werden kann, um die Wirkstoffentdeckungskampagnen gegen anspruchsvolle therapeutische Ziele weiter zu beschleunigen.
English
We describe the accurate prediction of ligand-protein interaction (LPI)
affinities, also known as drug-target interactions (DTI), with instruction
fine-tuned pretrained generative small language models (SLMs). We achieved
accurate predictions for a range of affinity values associated with
ligand-protein interactions on out-of-sample data in a zero-shot setting. Only
the SMILES string of the ligand and the amino acid sequence of the protein were
used as the model inputs. Our results demonstrate a clear improvement over
machine learning (ML) and free-energy perturbation (FEP+) based methods in
accurately predicting a range of ligand-protein interaction affinities, which
can be leveraged to further accelerate drug discovery campaigns against
challenging therapeutic targets.Summary
AI-Generated Summary