ChatPaper.aiChatPaper

Conception Multimodale Générale des Protéines Permettant l'Encodage ADN de la Chimie

General Multimodal Protein Design Enables DNA-Encoding of Chemistry

April 6, 2026
Auteurs: Jarrid Rector-Brooks, Théophile Lambert, Marta Skreta, Daniel Roth, Yueming Long, Zi-Qi Li, Xi Zhang, Miruna Cretu, Francesca-Zhoufan Li, Tanvi Ganapathy, Emily Jin, Avishek Joey Bose, Jason Yang, Kirill Neklyudov, Yoshua Bengio, Alexander Tong, Frances H. Arnold, Cheng-Hao Liu
cs.AI

Résumé

L'évolution est un moteur extraordinaire de diversité enzymatique, mais la chimie qu'elle a explorée ne représente qu'une infime partie de ce que l'ADN peut encoder. Les modèles génératifs profonds peuvent concevoir de nouvelles protéines qui se lient à des ligands, mais aucun n'a créé d'enzymes sans pré-spécifier les résidus catalytiques. Nous présentons DISCO (DIffusion pour la CO-conception de séquences et de structures), un modèle multimodal qui co-conçoit la séquence protéique et la structure 3D autour de biomolécules arbitraires, ainsi que des méthodes de mise à l'échelle lors de l'inférence qui optimisent les objectifs dans les deux modalités. Conditionné uniquement sur des intermédiaires réactionnels, DISCO conçoit des enzymes à hème diverses avec des géométries de site actif novatrices. Ces enzymes catalysent des réactions de transfert de carbène nouvelles pour la nature, notamment la cyclopropanation d'alcènes, la spirocyclopropanation, et des insertions B-H et C(sp³)-H, avec des activités élevées dépassant celles d'enzymes issues du génie protéique. La mutagénèse aléatoire d'un design sélectionné a en outre confirmé que l'activité enzymatique peut être améliorée par évolution dirigée. En offrant une voie évolutive et évoluable vers de nouvelles enzymes, DISCO élargit le champ potentiel des transformations génétiquement encodables. Le code est disponible à l'adresse https://github.com/DISCO-design/DISCO.
English
Evolution is an extraordinary engine for enzymatic diversity, yet the chemistry it has explored remains a narrow slice of what DNA can encode. Deep generative models can design new proteins that bind ligands, but none have created enzymes without pre-specifying catalytic residues. We introduce DISCO (DIffusion for Sequence-structure CO-design), a multimodal model that co-designs protein sequence and 3D structure around arbitrary biomolecules, as well as inference-time scaling methods that optimize objectives across both modalities. Conditioned solely on reactive intermediates, DISCO designs diverse heme enzymes with novel active-site geometries. These enzymes catalyze new-to-nature carbene-transfer reactions, including alkene cyclopropanation, spirocyclopropanation, B-H, and C(sp^3)-H insertions, with high activities exceeding those of engineered enzymes. Random mutagenesis of a selected design further confirmed that enzyme activity can be improved through directed evolution. By providing a scalable route to evolvable enzymes, DISCO broadens the potential scope of genetically encodable transformations. Code is available at https://github.com/DISCO-design/DISCO.
PDF201April 9, 2026