EnzyControl: Adición de Control Funcional y Específico de Sustrato para la Generación de Estructuras de Enzimas
EnzyControl: Adding Functional and Substrate-Specific Control for Enzyme Backbone Generation
October 29, 2025
Autores: Chao Song, Zhiyuan Liu, Han Huang, Liang Wang, Qiong Wang, Jianyu Shi, Hui Yu, Yihang Zhou, Yang Zhang
cs.AI
Resumen
Diseñar estructuras de enzimas con funcionalidad específica para sustratos es un desafío crítico en la ingeniería de proteínas computacional. Los modelos generativos actuales sobresalen en el diseño de proteínas, pero enfrentan limitaciones en cuanto a datos de unión, control específico de sustrato y flexibilidad para la generación de novo de estructuras de enzimas. Para abordar esto, presentamos EnzyBind, un conjunto de datos con 11,100 pares enzima-sustrato validados experimentalmente, específicamente seleccionados de PDBbind. Sobre esta base, proponemos EnzyControl, un método que permite el control funcional y específico del sustrato en la generación de estructuras de enzimas. Nuestro enfoque genera estructuras de enzimas condicionadas a sitios catalíticos anotados con MSA y sus sustratos correspondientes, los cuales se extraen automáticamente de los datos curados de pares enzima-sustrato. En el núcleo de EnzyControl se encuentra EnzyAdapter, un componente modular y ligero integrado en un modelo preentrenado de andamiaje de motivos, permitiéndole adquirir conciencia del sustrato. Un paradigma de entrenamiento en dos etapas refina aún más la capacidad del modelo para generar estructuras de enzimas precisas y funcionales. Los experimentos muestran que nuestro EnzyControl logra el mejor rendimiento en métricas estructurales y funcionales en los benchmarks EnzyBind y EnzyBench, con mejoras particularmente notables del 13% en la capacidad de diseño y del 13% en la eficiencia catalítica en comparación con los modelos base. El código se ha publicado en https://github.com/Vecteur-libre/EnzyControl.
English
Designing enzyme backbones with substrate-specific functionality is a
critical challenge in computational protein engineering. Current generative
models excel in protein design but face limitations in binding data,
substrate-specific control, and flexibility for de novo enzyme backbone
generation. To address this, we introduce EnzyBind, a dataset with 11,100
experimentally validated enzyme-substrate pairs specifically curated from
PDBbind. Building on this, we propose EnzyControl, a method that enables
functional and substrate-specific control in enzyme backbone generation. Our
approach generates enzyme backbones conditioned on MSA-annotated catalytic
sites and their corresponding substrates, which are automatically extracted
from curated enzyme-substrate data. At the core of EnzyControl is EnzyAdapter,
a lightweight, modular component integrated into a pretrained motif-scaffolding
model, allowing it to become substrate-aware. A two-stage training paradigm
further refines the model's ability to generate accurate and functional enzyme
structures. Experiments show that our EnzyControl achieves the best performance
across structural and functional metrics on EnzyBind and EnzyBench benchmarks,
with particularly notable improvements of 13\% in designability and 13\% in
catalytic efficiency compared to the baseline models. The code is released at
https://github.com/Vecteur-libre/EnzyControl.