Diseño de Proteínas De Novo de Extremo a Extremo con Dinámicas Personalizadas Utilizando un Modelo de Difusión Basado en Lenguaje
Agentic End-to-End De Novo Protein Design for Tailored Dynamics Using a Language Diffusion Model
February 14, 2025
Autores: Bo Ni, Markus J. Buehler
cs.AI
Resumen
Las proteínas son máquinas moleculares dinámicas cuyas funciones biológicas, que abarcan la catálisis enzimática, la transducción de señales y la adaptación estructural, están intrínsecamente ligadas a sus movimientos. Sin embargo, diseñar proteínas con propiedades dinámicas específicas sigue siendo un desafío debido a las relaciones complejas y degeneradas entre secuencia, estructura y movimiento molecular. Aquí presentamos VibeGen, un marco de IA generativa que permite el diseño de novo de proteínas de extremo a extremo condicionado por vibraciones de modos normales. VibeGen emplea una arquitectura dual de modelos, que incluye un diseñador de proteínas que genera candidatos de secuencia basados en modos vibratorios especificados y un predictor de proteínas que evalúa su precisión dinámica. Este enfoque combina diversidad, precisión y novedad durante el proceso de diseño. Mediante simulaciones moleculares de átomo completo como validación directa, demostramos que las proteínas diseñadas reproducen con precisión las amplitudes de los modos normales prescritos a lo largo de la cadena principal, adoptando diversas estructuras estables y funcionalmente relevantes. Cabe destacar que las secuencias generadas son de novo, sin mostrar similitudes significativas con proteínas naturales, lo que expande el espacio accesible de proteínas más allá de las restricciones evolutivas. Nuestro trabajo integra la dinámica proteica en el diseño generativo de proteínas y establece un vínculo directo y bidireccional entre la secuencia y el comportamiento vibratorio, abriendo nuevas vías para la ingeniería de biomoléculas con propiedades dinámicas y funcionales personalizadas. Este marco tiene amplias implicaciones para el diseño racional de enzimas flexibles, andamios dinámicos y biomateriales, allanando el camino hacia la ingeniería de proteínas impulsada por IA basada en la dinámica molecular.
English
Proteins are dynamic molecular machines whose biological functions, spanning
enzymatic catalysis, signal transduction, and structural adaptation, are
intrinsically linked to their motions. Designing proteins with targeted dynamic
properties, however, remains a challenge due to the complex, degenerate
relationships between sequence, structure, and molecular motion. Here, we
introduce VibeGen, a generative AI framework that enables end-to-end de novo
protein design conditioned on normal mode vibrations. VibeGen employs an
agentic dual-model architecture, comprising a protein designer that generates
sequence candidates based on specified vibrational modes and a protein
predictor that evaluates their dynamic accuracy. This approach synergizes
diversity, accuracy, and novelty during the design process. Via full-atom
molecular simulations as direct validation, we demonstrate that the designed
proteins accurately reproduce the prescribed normal mode amplitudes across the
backbone while adopting various stable, functionally relevant structures.
Notably, generated sequences are de novo, exhibiting no significant similarity
to natural proteins, thereby expanding the accessible protein space beyond
evolutionary constraints. Our work integrates protein dynamics into generative
protein design, and establishes a direct, bidirectional link between sequence
and vibrational behavior, unlocking new pathways for engineering biomolecules
with tailored dynamical and functional properties. This framework holds broad
implications for the rational design of flexible enzymes, dynamic scaffolds,
and biomaterials, paving the way toward dynamics-informed AI-driven protein
engineering.Summary
AI-Generated Summary