ChatPaper.aiChatPaper

EnzyControl: Adicionando Controle Funcional e Específico ao Substrato para Geração de Estruturas de Enzimas

EnzyControl: Adding Functional and Substrate-Specific Control for Enzyme Backbone Generation

October 29, 2025
Autores: Chao Song, Zhiyuan Liu, Han Huang, Liang Wang, Qiong Wang, Jianyu Shi, Hui Yu, Yihang Zhou, Yang Zhang
cs.AI

Resumo

O projeto de estruturas proteicas enzimáticas com funcionalidade específica para substratos é um desafio crítico na engenharia de proteínas computacional. Os modelos generativos atuais destacam-se no design de proteínas, mas enfrentam limitações em dados de ligação, controle de especificidade para substratos e flexibilidade para geração de novo de estruturas enzimáticas. Para resolver isso, introduzimos o EnzyBind, um conjunto de dados com 11.100 pares enzima-substrato validados experimentalmente, especificamente curados a partir do PDBbind. Com base nisso, propomos o EnzyControl, um método que permite controle funcional e específico para substratos na geração de estruturas enzimáticas. Nossa abordagem gera estruturas enzimáticas condicionadas a sítios catalíticos anotados por MSA e seus substratos correspondentes, que são extraídos automaticamente de dados curados de pares enzima-substrato. O núcleo do EnzyControl é o EnzyAdapter, um componente modular e leve integrado a um modelo pré-treinado de estruturação de motivos, permitindo que ele se torne consciente do substrato. Um paradigma de treinamento em dois estágios refina ainda mais a capacidade do modelo de gerar estruturas enzimáticas precisas e funcionais. Experimentos mostram que nosso EnzyControl alcança o melhor desempenho em métricas estruturais e funcionais nos benchmarks EnzyBind e EnzyBench, com melhorias particularmente notáveis de 13% em projetabilidade e 13% em eficiência catalítica em comparação com os modelos de base. O código está disponível em https://github.com/Vecteur-libre/EnzyControl.
English
Designing enzyme backbones with substrate-specific functionality is a critical challenge in computational protein engineering. Current generative models excel in protein design but face limitations in binding data, substrate-specific control, and flexibility for de novo enzyme backbone generation. To address this, we introduce EnzyBind, a dataset with 11,100 experimentally validated enzyme-substrate pairs specifically curated from PDBbind. Building on this, we propose EnzyControl, a method that enables functional and substrate-specific control in enzyme backbone generation. Our approach generates enzyme backbones conditioned on MSA-annotated catalytic sites and their corresponding substrates, which are automatically extracted from curated enzyme-substrate data. At the core of EnzyControl is EnzyAdapter, a lightweight, modular component integrated into a pretrained motif-scaffolding model, allowing it to become substrate-aware. A two-stage training paradigm further refines the model's ability to generate accurate and functional enzyme structures. Experiments show that our EnzyControl achieves the best performance across structural and functional metrics on EnzyBind and EnzyBench benchmarks, with particularly notable improvements of 13\% in designability and 13\% in catalytic efficiency compared to the baseline models. The code is released at https://github.com/Vecteur-libre/EnzyControl.
PDF21December 2, 2025