ChatPaper.aiChatPaper

EnzyControl : Ajout d'un contrôle fonctionnel et spécifique au substrat pour la génération de squelettes enzymatiques

EnzyControl: Adding Functional and Substrate-Specific Control for Enzyme Backbone Generation

October 29, 2025
papers.authors: Chao Song, Zhiyuan Liu, Han Huang, Liang Wang, Qiong Wang, Jianyu Shi, Hui Yu, Yihang Zhou, Yang Zhang
cs.AI

papers.abstract

La conception de squelettes enzymatiques dotés d'une fonctionnalité spécifique au substrat constitue un défi majeur en ingénierie des protéines computationnelle. Les modèles génératifs actuels excellent dans la conception de protéines mais présentent des limitations concernant les données de liaison, le contrôle spécifique au substrat et la flexibilité pour la génération de novo de squelettes enzymatiques. Pour résoudre ce problème, nous présentons EnzyBind, un jeu de données contenant 11 100 paires enzyme-substrat validées expérimentalement et spécifiquement constituées à partir de PDBbind. Sur cette base, nous proposons EnzyControl, une méthode permettant un contrôle fonctionnel et spécifique au substrat dans la génération de squelettes enzymatiques. Notre approche génère des squelettes enzymatiques conditionnés par des sites catalytiques annotés par MSA et leurs substrats correspondants, qui sont extraits automatiquement des données curatisées de paires enzyme-substrat. Au cœur d'EnzyControl se trouve EnzyAdapter, un composant modulaire léger intégré à un modèle pré-entraîné de conception motif-châssis, lui permettant de devenir conscient du substrat. Un paradigme d'entraînement en deux étapes affine davantage la capacité du modèle à générer des structures enzymatiques précises et fonctionnelles. Les expériences montrent que notre EnzyControl obtient les meilleures performances sur les métriques structurelles et fonctionnelles des benchmarks EnzyBind et EnzyBench, avec des améliorations particulièrement notables de 13 % en concevabilité et de 13 % en efficacité catalytique par rapport aux modèles de référence. Le code est disponible à l'adresse https://github.com/Vecteur-libre/EnzyControl.
English
Designing enzyme backbones with substrate-specific functionality is a critical challenge in computational protein engineering. Current generative models excel in protein design but face limitations in binding data, substrate-specific control, and flexibility for de novo enzyme backbone generation. To address this, we introduce EnzyBind, a dataset with 11,100 experimentally validated enzyme-substrate pairs specifically curated from PDBbind. Building on this, we propose EnzyControl, a method that enables functional and substrate-specific control in enzyme backbone generation. Our approach generates enzyme backbones conditioned on MSA-annotated catalytic sites and their corresponding substrates, which are automatically extracted from curated enzyme-substrate data. At the core of EnzyControl is EnzyAdapter, a lightweight, modular component integrated into a pretrained motif-scaffolding model, allowing it to become substrate-aware. A two-stage training paradigm further refines the model's ability to generate accurate and functional enzyme structures. Experiments show that our EnzyControl achieves the best performance across structural and functional metrics on EnzyBind and EnzyBench benchmarks, with particularly notable improvements of 13\% in designability and 13\% in catalytic efficiency compared to the baseline models. The code is released at https://github.com/Vecteur-libre/EnzyControl.
PDF21December 2, 2025