EnzyControl: Hinzufügung funktionaler und substratspezifischer Kontrolle für die Enzym-Gerüstgenerierung
EnzyControl: Adding Functional and Substrate-Specific Control for Enzyme Backbone Generation
October 29, 2025
papers.authors: Chao Song, Zhiyuan Liu, Han Huang, Liang Wang, Qiong Wang, Jianyu Shi, Hui Yu, Yihang Zhou, Yang Zhang
cs.AI
papers.abstract
Das Design von Enzymrückgraten mit substratspezifischer Funktionalität stellt eine zentrale Herausforderung in der computergestützten Proteintechnik dar. Aktuelle generative Modelle sind im Proteindesign zwar leistungsstark, stoßen jedoch bei Bindungsdaten, substratspezifischer Steuerung und Flexibilität für die de novo-Generierung von Enzymrückgraten an Grenzen. Um dies zu adressieren, stellen wir EnzyBind vor, einen Datensatz mit 11.100 experimentell validierten Enzym-Substrat-Paaren, die speziell aus PDBbind kuratiert wurden. Darauf aufbauend präsentieren wir EnzyControl, eine Methode zur funktionalen und substratspezifischen Steuerung bei der Generierung von Enzymrückgraten. Unser Ansatz erzeugt Enzymrückgräte, die auf MSA-annotierte katalytische Stellen und deren entsprechende Substrate konditioniert sind, welche automatisch aus den kuratierten Enzym-Substrat-Daten extrahiert werden. Kernstück von EnzyControl ist der EnzyAdapter, eine leichtgewichtige, modulare Komponente, die in ein vortrainiertes Motif-Scaffolding-Modell integriert ist und es ermöglicht, substratsensitiv zu werden. Ein zweistufiges Trainingsparadigma verfeinert weiterhin die Fähigkeit des Modells, präzise und funktionale Enzymstrukturen zu generieren. Experimente zeigen, dass unser EnzyControl auf den EnzyBind- und EnzyBench-Benchmarks die beste Leistung über strukturelle und funktionale Metriken hinweg erzielt, mit besonders bemerkenswerten Verbesserungen von 13 % in der Designierbarkeit und 13 % in der katalytischen Effizienz im Vergleich zu den Baseline-Modellen. Der Code ist unter https://github.com/Vecteur-libre/EnzyControl verfügbar.
English
Designing enzyme backbones with substrate-specific functionality is a
critical challenge in computational protein engineering. Current generative
models excel in protein design but face limitations in binding data,
substrate-specific control, and flexibility for de novo enzyme backbone
generation. To address this, we introduce EnzyBind, a dataset with 11,100
experimentally validated enzyme-substrate pairs specifically curated from
PDBbind. Building on this, we propose EnzyControl, a method that enables
functional and substrate-specific control in enzyme backbone generation. Our
approach generates enzyme backbones conditioned on MSA-annotated catalytic
sites and their corresponding substrates, which are automatically extracted
from curated enzyme-substrate data. At the core of EnzyControl is EnzyAdapter,
a lightweight, modular component integrated into a pretrained motif-scaffolding
model, allowing it to become substrate-aware. A two-stage training paradigm
further refines the model's ability to generate accurate and functional enzyme
structures. Experiments show that our EnzyControl achieves the best performance
across structural and functional metrics on EnzyBind and EnzyBench benchmarks,
with particularly notable improvements of 13\% in designability and 13\% in
catalytic efficiency compared to the baseline models. The code is released at
https://github.com/Vecteur-libre/EnzyControl.