ChatPaper.aiChatPaper

Progettazione Proteica Multimodale Generale Consente la Codifica Chimica tramite DNA

General Multimodal Protein Design Enables DNA-Encoding of Chemistry

April 6, 2026
Autori: Jarrid Rector-Brooks, Théophile Lambert, Marta Skreta, Daniel Roth, Yueming Long, Zi-Qi Li, Xi Zhang, Miruna Cretu, Francesca-Zhoufan Li, Tanvi Ganapathy, Emily Jin, Avishek Joey Bose, Jason Yang, Kirill Neklyudov, Yoshua Bengio, Alexander Tong, Frances H. Arnold, Cheng-Hao Liu
cs.AI

Abstract

L'evoluzione è un motore straordinario per la diversità enzimatica, eppure la chimica che ha esplorato rappresenta solo una piccola porzione di ciò che il DNA può codificare. I modelli generativi profondi possono progettare nuove proteine che legano ligandi, ma nessuno ha creato enzimi senza pre-specificare i residui catalitici. Introduciamo DISCO (DIffusion for Sequence-structure CO-design), un modello multimodale che co-progetta la sequenza proteica e la struttura 3D attorno a biomolecole arbitrarie, insieme a metodi di scaling durante l'inferenza che ottimizzano gli obiettivi attraverso entrambe le modalità. Condizionato unicamente su intermedi reattivi, DISCO progetta emoenzimi diversificati con geometrie del sito attivo nuove. Questi enzimi catalizzano reazioni di trasferimento di carbene nuove per la natura, incluse ciclopropanazioni di alcheni, spirociclopropanazioni, inserzioni B-H e C(sp³)-H, con attività elevate che superano quelle di enzimi ingegnerizzati. La mutagenesi casuale di un progetto selezionato ha ulteriormente confermato che l'attività enzimatica può essere migliorata attraverso l'evoluzione diretta. Fornendo una via scalabile per enzimi evolvibili, DISCO amplia il potenziale ambito delle trasformazioni geneticamente codificabili. Il codice è disponibile all'indirizzo https://github.com/DISCO-design/DISCO.
English
Evolution is an extraordinary engine for enzymatic diversity, yet the chemistry it has explored remains a narrow slice of what DNA can encode. Deep generative models can design new proteins that bind ligands, but none have created enzymes without pre-specifying catalytic residues. We introduce DISCO (DIffusion for Sequence-structure CO-design), a multimodal model that co-designs protein sequence and 3D structure around arbitrary biomolecules, as well as inference-time scaling methods that optimize objectives across both modalities. Conditioned solely on reactive intermediates, DISCO designs diverse heme enzymes with novel active-site geometries. These enzymes catalyze new-to-nature carbene-transfer reactions, including alkene cyclopropanation, spirocyclopropanation, B-H, and C(sp^3)-H insertions, with high activities exceeding those of engineered enzymes. Random mutagenesis of a selected design further confirmed that enzyme activity can be improved through directed evolution. By providing a scalable route to evolvable enzymes, DISCO broadens the potential scope of genetically encodable transformations. Code is available at https://github.com/DISCO-design/DISCO.
PDF201April 9, 2026