ChatPaper.aiChatPaper

Универсальный мультимодальный дизайн белков позволяет кодировать химические свойства с помощью ДНК

General Multimodal Protein Design Enables DNA-Encoding of Chemistry

April 6, 2026
Авторы: Jarrid Rector-Brooks, Théophile Lambert, Marta Skreta, Daniel Roth, Yueming Long, Zi-Qi Li, Xi Zhang, Miruna Cretu, Francesca-Zhoufan Li, Tanvi Ganapathy, Emily Jin, Avishek Joey Bose, Jason Yang, Kirill Neklyudov, Yoshua Bengio, Alexander Tong, Frances H. Arnold, Cheng-Hao Liu
cs.AI

Аннотация

Эволюция представляет собой мощный механизм для создания ферментативного разнообразия, однако исследованный ею химический репертуар остается лишь узкой частью того, что способна кодировать ДНК. Глубокие генеративные модели могут создавать новые белки, связывающие лиганды, но ни одна из них не позволяла получать ферменты без предварительного задания каталитических остатков. Мы представляем DISCO (DIffusion for Sequence-structure CO-design) — мультимодальную модель, которая совместно проектирует аминокислотную последовательность и трёхмерную структуру белка вокруг произвольных биомолекул, а также методы масштабирования на этапе вывода, оптимизирующие целевые функции в обеих модальностях. Обучаясь исключительно на реакционных интермедиатах, DISCO создаёт разнообразные гем-содержащие ферменты с новыми геометриями активного центра. Эти ферменты катализируют несвойственные природе реакции карбенового переноса, включая циклопропанирование алкенов, спироциклопропанирование, а также B-H и C(sp³)-H вставки, демонстрируя высокую активность, превосходящую показатели инженерных ферментов. Случайный мутагенез выбранного дизайна дополнительно подтвердил, что активность фермента может быть повышена с помощью направленной эволюции. Предоставляя масштабируемый путь к созданию эволюционноспособных ферментов, DISCO расширяет потенциальные границы генетически кодируемых химических превращений. Код доступен по адресу https://github.com/DISCO-design/DISCO.
English
Evolution is an extraordinary engine for enzymatic diversity, yet the chemistry it has explored remains a narrow slice of what DNA can encode. Deep generative models can design new proteins that bind ligands, but none have created enzymes without pre-specifying catalytic residues. We introduce DISCO (DIffusion for Sequence-structure CO-design), a multimodal model that co-designs protein sequence and 3D structure around arbitrary biomolecules, as well as inference-time scaling methods that optimize objectives across both modalities. Conditioned solely on reactive intermediates, DISCO designs diverse heme enzymes with novel active-site geometries. These enzymes catalyze new-to-nature carbene-transfer reactions, including alkene cyclopropanation, spirocyclopropanation, B-H, and C(sp^3)-H insertions, with high activities exceeding those of engineered enzymes. Random mutagenesis of a selected design further confirmed that enzyme activity can be improved through directed evolution. By providing a scalable route to evolvable enzymes, DISCO broadens the potential scope of genetically encodable transformations. Code is available at https://github.com/DISCO-design/DISCO.
PDF201April 9, 2026