Точное предсказание аффинности взаимодействия лиганда и белка с помощью тонко настроенных малых языковых моделей.

Аннотация

Мы описываем точное предсказание аффинности взаимодействия лиганд-белок (LPI), также известного как взаимодействие препарат-мишень (DTI), с помощью инструкций, настроенных на предварительно обученные генеративные модели малого языка (SLM). Мы достигли точных прогнозов для различных значений аффинности, связанных с взаимодействиями лиганд-белок на данных, не входивших в обучающую выборку, в режиме нулевого обучения. В качестве входных данных модели использовались только строка SMILES лиганда и последовательность аминокислот белка. Наши результаты демонстрируют явное улучшение по сравнению с методами машинного обучения (ML) и методами на основе свободной энергии (FEP+) в точном предсказании различных аффинностей взаимодействия лиганд-белок, что может быть использовано для ускорения кампаний по поиску лекарств против сложных терапевтических целей.

English

We describe the accurate prediction of ligand-protein interaction (LPI) affinities, also known as drug-target interactions (DTI), with instruction fine-tuned pretrained generative small language models (SLMs). We achieved accurate predictions for a range of affinity values associated with ligand-protein interactions on out-of-sample data in a zero-shot setting. Only the SMILES string of the ligand and the amino acid sequence of the protein were used as the model inputs. Our results demonstrate a clear improvement over machine learning (ML) and free-energy perturbation (FEP+) based methods in accurately predicting a range of ligand-protein interaction affinities, which can be leveraged to further accelerate drug discovery campaigns against challenging therapeutic targets.

Точное предсказание аффинности взаимодействия лиганда и белка с помощью тонко настроенных малых языковых моделей.

Accurate Prediction of Ligand-Protein Interaction Affinities with Fine-Tuned Small Language Models

Аннотация

Support