Algemene Multimodale Eiwitontwerp Maakt DNA-codering van Chemie Mogelijk
General Multimodal Protein Design Enables DNA-Encoding of Chemistry
April 6, 2026
Auteurs: Jarrid Rector-Brooks, Théophile Lambert, Marta Skreta, Daniel Roth, Yueming Long, Zi-Qi Li, Xi Zhang, Miruna Cretu, Francesca-Zhoufan Li, Tanvi Ganapathy, Emily Jin, Avishek Joey Bose, Jason Yang, Kirill Neklyudov, Yoshua Bengio, Alexander Tong, Frances H. Arnold, Cheng-Hao Liu
cs.AI
Samenvatting
Evolutie is een buitengewone motor voor enzymatische diversiteit, maar de chemie die zij heeft verkend, blijft een smalle doorsnede van wat DNA kan coderen. Diepe generatieve modellen kunnen nieuwe eiwitten ontwerpen die liganden binden, maar geen ervan heeft enzymen gecreëerd zonder vooraf specifieke katalytische residuen op te geven. Wij introduceren DISCO (DIffusion for Sequence-structure CO-design), een multimodaal model dat eiwitsequenties en 3D-structuur gezamenlijk ontwerpt rondom willekeurige biomoleculen, evenals schaalingsmethoden voor inferentietijd die doelstellingen over beide modaliteiten optimaliseren. Uitsluitend geconditioneerd op reactieve intermediairen, ontwerpt DISCO diverse heem-enzymen met nieuwe actieve-site-geometrieën. Deze enzymen katalyseren nieuwe-voor-de-natuur carbene-overdrachtsreacties, waaronder alkeencyclopropanering, spirocyclopropanering, B-H-inserties en C(sp³)-H-inserties, met hoge activiteiten die die van gemanipuleerde enzymen overtreffen. Willekeurige mutagenese van een geselecteerd ontwerp bevestigde verder dat de enzymactiviteit kan worden verbeterd door middel van gerichte evolutie. Door een schaalbare route naar evolueerbare enzymen te bieden, verbreedt DISCO het potentiële bereik van genetisch codeerbare transformaties. Code is beschikbaar op https://github.com/DISCO-design/DISCO.
English
Evolution is an extraordinary engine for enzymatic diversity, yet the chemistry it has explored remains a narrow slice of what DNA can encode. Deep generative models can design new proteins that bind ligands, but none have created enzymes without pre-specifying catalytic residues. We introduce DISCO (DIffusion for Sequence-structure CO-design), a multimodal model that co-designs protein sequence and 3D structure around arbitrary biomolecules, as well as inference-time scaling methods that optimize objectives across both modalities. Conditioned solely on reactive intermediates, DISCO designs diverse heme enzymes with novel active-site geometries. These enzymes catalyze new-to-nature carbene-transfer reactions, including alkene cyclopropanation, spirocyclopropanation, B-H, and C(sp^3)-H insertions, with high activities exceeding those of engineered enzymes. Random mutagenesis of a selected design further confirmed that enzyme activity can be improved through directed evolution. By providing a scalable route to evolvable enzymes, DISCO broadens the potential scope of genetically encodable transformations. Code is available at https://github.com/DISCO-design/DISCO.