EnzyControl: Добавление функционального и субстрат-специфического контроля для генерации каркасов ферментов
EnzyControl: Adding Functional and Substrate-Specific Control for Enzyme Backbone Generation
October 29, 2025
Авторы: Chao Song, Zhiyuan Liu, Han Huang, Liang Wang, Qiong Wang, Jianyu Shi, Hui Yu, Yihang Zhou, Yang Zhang
cs.AI
Аннотация
Проектирование белковых остова ферментов с субстрат-специфичной функциональностью представляет собой ключевую задачу в вычислительной инженерии белков. Современные генеративные модели преуспевают в дизайне белков, но сталкиваются с ограничениями в данных о связывании, субстрат-специфичном контроле и гибкости для de novo генерации остова фермента. Для решения этой проблемы мы представляем EnzyBind — набор данных, содержащий 11 100 экспериментально подтверждённых пар фермент-субстрат, специально отобранных из PDBbind. На его основе мы предлагаем EnzyControl, метод, обеспечивающий функциональный и субстрат-специфичный контроль при генерации остова фермента. Наш подход генерирует белковые остовы ферментов, обусловленные MSA-аннотированными каталитическими центрами и соответствующими им субстратами, которые автоматически извлекаются из курированных данных о фермент-субстратных парах. В основе EnzyControl лежит EnzyAdapter — лёгкий, модульный компонент, интегрированный в предварительно обученную модель скаффолдинга мотивов, что позволяет ей учитывать субстрат. Двухэтапная парадигма обучения дополнительно оттачивает способность модели генерировать точные и функциональные структуры ферментов. Эксперименты показывают, что наш EnzyControl демонстрирует наилучшие результаты по структурным и функциональным метрикам на бенчмарках EnzyBind и EnzyBench, с особенно значительным улучшением на 13% в дизайнабельности и на 13% в каталитической эффективности по сравнению с базовыми моделями. Код доступен по адресу https://github.com/Vecteur-libre/EnzyControl.
English
Designing enzyme backbones with substrate-specific functionality is a
critical challenge in computational protein engineering. Current generative
models excel in protein design but face limitations in binding data,
substrate-specific control, and flexibility for de novo enzyme backbone
generation. To address this, we introduce EnzyBind, a dataset with 11,100
experimentally validated enzyme-substrate pairs specifically curated from
PDBbind. Building on this, we propose EnzyControl, a method that enables
functional and substrate-specific control in enzyme backbone generation. Our
approach generates enzyme backbones conditioned on MSA-annotated catalytic
sites and their corresponding substrates, which are automatically extracted
from curated enzyme-substrate data. At the core of EnzyControl is EnzyAdapter,
a lightweight, modular component integrated into a pretrained motif-scaffolding
model, allowing it to become substrate-aware. A two-stage training paradigm
further refines the model's ability to generate accurate and functional enzyme
structures. Experiments show that our EnzyControl achieves the best performance
across structural and functional metrics on EnzyBind and EnzyBench benchmarks,
with particularly notable improvements of 13\% in designability and 13\% in
catalytic efficiency compared to the baseline models. The code is released at
https://github.com/Vecteur-libre/EnzyControl.