Previsão precisa das afinidades de interação ligante-proteína com Modelos de Linguagem Pequenos Ajustados.

Resumo

Descrevemos a previsão precisa das afinidades de interação ligante-proteína (LPI), também conhecidas como interações fármaco-alvo (DTI), com modelos de linguagem pequenos generativos pré-treinados e ajustados por instruções (SLMs). Alcançamos previsões precisas para uma variedade de valores de afinidade associados às interações ligante-proteína em dados fora da amostra em um cenário de zero-shot. Apenas a sequência SMILES do ligante e a sequência de aminoácidos da proteína foram usadas como entradas do modelo. Nossos resultados demonstram uma clara melhoria em relação aos métodos baseados em aprendizado de máquina (ML) e perturbação de energia livre (FEP+) na previsão precisa de uma variedade de afinidades de interação ligante-proteína, o que pode ser aproveitado para acelerar ainda mais campanhas de descoberta de medicamentos contra alvos terapêuticos desafiadores.

English

We describe the accurate prediction of ligand-protein interaction (LPI) affinities, also known as drug-target interactions (DTI), with instruction fine-tuned pretrained generative small language models (SLMs). We achieved accurate predictions for a range of affinity values associated with ligand-protein interactions on out-of-sample data in a zero-shot setting. Only the SMILES string of the ligand and the amino acid sequence of the protein were used as the model inputs. Our results demonstrate a clear improvement over machine learning (ML) and free-energy perturbation (FEP+) based methods in accurately predicting a range of ligand-protein interaction affinities, which can be leveraged to further accelerate drug discovery campaigns against challenging therapeutic targets.

Previsão precisa das afinidades de interação ligante-proteína com Modelos de Linguagem Pequenos Ajustados.

Accurate Prediction of Ligand-Protein Interaction Affinities with Fine-Tuned Small Language Models

Resumo

Support