Prédiction précise des affinités d'interaction ligand-protéine avec des petits modèles de langage affinés
Accurate Prediction of Ligand-Protein Interaction Affinities with Fine-Tuned Small Language Models
June 27, 2024
Auteurs: Ben Fauber
cs.AI
Résumé
Nous décrivons la prédiction précise des affinités d'interaction ligand-protéine (LPI), également appelées interactions médicament-cible (DTI), à l'aide de petits modèles de langage génératifs (SLM) pré-entraînés et affinés par instruction. Nous avons obtenu des prédictions précises pour une gamme de valeurs d'affinité associées aux interactions ligand-protéine sur des données hors échantillon dans un cadre zero-shot. Seule la chaîne SMILES du ligand et la séquence d'acides aminés de la protéine ont été utilisées comme entrées du modèle. Nos résultats démontrent une nette amélioration par rapport aux méthodes basées sur l'apprentissage automatique (ML) et la perturbation d'énergie libre (FEP+) pour prédire avec précision une gamme d'affinités d'interaction ligand-protéine, ce qui peut être exploité pour accélérer davantage les campagnes de découverte de médicaments contre des cibles thérapeutiques complexes.
English
We describe the accurate prediction of ligand-protein interaction (LPI)
affinities, also known as drug-target interactions (DTI), with instruction
fine-tuned pretrained generative small language models (SLMs). We achieved
accurate predictions for a range of affinity values associated with
ligand-protein interactions on out-of-sample data in a zero-shot setting. Only
the SMILES string of the ligand and the amino acid sequence of the protein were
used as the model inputs. Our results demonstrate a clear improvement over
machine learning (ML) and free-energy perturbation (FEP+) based methods in
accurately predicting a range of ligand-protein interaction affinities, which
can be leveraged to further accelerate drug discovery campaigns against
challenging therapeutic targets.Summary
AI-Generated Summary