Design de Proteínas De Novo de Ponta a Ponta Agêntico para Dinâmicas Sob Medida Usando um Modelo de Difusão de Linguagem
Agentic End-to-End De Novo Protein Design for Tailored Dynamics Using a Language Diffusion Model
February 14, 2025
Autores: Bo Ni, Markus J. Buehler
cs.AI
Resumo
As proteínas são máquinas moleculares dinâmicas cujas funções biológicas, abrangendo catálise enzimática, transdução de sinais e adaptação estrutural, estão intrinsecamente ligadas aos seus movimentos. No entanto, projetar proteínas com propriedades dinâmicas específicas ainda é um desafio devido às complexas e degeneradas relações entre sequência, estrutura e movimento molecular. Aqui, apresentamos o VibeGen, um framework de IA generativa que possibilita o design de proteínas de novo, condicionado às vibrações de modos normais. O VibeGen emprega uma arquitetura de modelo duplo agente, composta por um designer de proteínas que gera candidatos de sequência com base em modos vibracionais especificados e um preditor de proteínas que avalia sua precisão dinâmica. Essa abordagem potencializa a diversidade, precisão e novidade durante o processo de design. Por meio de simulações moleculares de átomos completos como validação direta, demonstramos que as proteínas projetadas reproduzem com precisão as amplitudes de modos normais prescritas ao longo do espinhaço, adotando diversas estruturas estáveis e funcionalmente relevantes. Notavelmente, as sequências geradas são de novo, não apresentando similaridade significativa com proteínas naturais, expandindo assim o espaço proteico acessível além das restrições evolutivas. Nosso trabalho integra a dinâmica proteica no design generativo de proteínas e estabelece uma ligação direta e bidirecional entre sequência e comportamento vibracional, abrindo novos caminhos para a engenharia de biomoléculas com propriedades dinâmicas e funcionais personalizadas. Esse framework tem amplas implicações para o design racional de enzimas flexíveis, estruturas dinâmicas e biomateriais, pavimentando o caminho para a engenharia de proteínas impulsionada por IA informada por dinâmica.
English
Proteins are dynamic molecular machines whose biological functions, spanning
enzymatic catalysis, signal transduction, and structural adaptation, are
intrinsically linked to their motions. Designing proteins with targeted dynamic
properties, however, remains a challenge due to the complex, degenerate
relationships between sequence, structure, and molecular motion. Here, we
introduce VibeGen, a generative AI framework that enables end-to-end de novo
protein design conditioned on normal mode vibrations. VibeGen employs an
agentic dual-model architecture, comprising a protein designer that generates
sequence candidates based on specified vibrational modes and a protein
predictor that evaluates their dynamic accuracy. This approach synergizes
diversity, accuracy, and novelty during the design process. Via full-atom
molecular simulations as direct validation, we demonstrate that the designed
proteins accurately reproduce the prescribed normal mode amplitudes across the
backbone while adopting various stable, functionally relevant structures.
Notably, generated sequences are de novo, exhibiting no significant similarity
to natural proteins, thereby expanding the accessible protein space beyond
evolutionary constraints. Our work integrates protein dynamics into generative
protein design, and establishes a direct, bidirectional link between sequence
and vibrational behavior, unlocking new pathways for engineering biomolecules
with tailored dynamical and functional properties. This framework holds broad
implications for the rational design of flexible enzymes, dynamic scaffolds,
and biomaterials, paving the way toward dynamics-informed AI-driven protein
engineering.Summary
AI-Generated Summary