Previsione accurata delle affinità di interazione ligando-proteina con piccoli modelli linguistici perfezionati

Abstract

Descriviamo la previsione accurata delle affinità di interazione ligando-proteina (LPI), note anche come interazioni farmaco-bersaglio (DTI), utilizzando piccoli modelli linguistici generativi (SLM) pre-addestrati e affinati tramite istruzioni. Abbiamo ottenuto previsioni accurate per un intervallo di valori di affinità associati alle interazioni ligando-proteina su dati fuori campione in un contesto zero-shot. Sono stati utilizzati solo la stringa SMILES del ligando e la sequenza di amminoacidi della proteina come input del modello. I nostri risultati dimostrano un chiaro miglioramento rispetto ai metodi basati sull'apprendimento automatico (ML) e sulla perturbazione dell'energia libera (FEP+) nella previsione accurata di un intervallo di affinità di interazione ligando-proteina, che può essere sfruttato per accelerare ulteriormente le campagne di scoperta di farmaci contro bersagli terapeutici complessi.

English

We describe the accurate prediction of ligand-protein interaction (LPI) affinities, also known as drug-target interactions (DTI), with instruction fine-tuned pretrained generative small language models (SLMs). We achieved accurate predictions for a range of affinity values associated with ligand-protein interactions on out-of-sample data in a zero-shot setting. Only the SMILES string of the ligand and the amino acid sequence of the protein were used as the model inputs. Our results demonstrate a clear improvement over machine learning (ML) and free-energy perturbation (FEP+) based methods in accurately predicting a range of ligand-protein interaction affinities, which can be leveraged to further accelerate drug discovery campaigns against challenging therapeutic targets.

Previsione accurata delle affinità di interazione ligando-proteina con piccoli modelli linguistici perfezionati

Accurate Prediction of Ligand-Protein Interaction Affinities with Fine-Tuned Small Language Models

Abstract

Support