Conception de protéines de novo agentique de bout en bout pour des dynamiques sur mesure à l'aide d'un modèle de diffusion linguistique
Agentic End-to-End De Novo Protein Design for Tailored Dynamics Using a Language Diffusion Model
February 14, 2025
Auteurs: Bo Ni, Markus J. Buehler
cs.AI
Résumé
Les protéines sont des machines moléculaires dynamiques dont les fonctions biologiques, englobant la catalyse enzymatique, la transduction de signaux et l'adaptation structurelle, sont intrinsèquement liées à leurs mouvements. Cependant, concevoir des protéines avec des propriétés dynamiques ciblées reste un défi en raison des relations complexes et dégénérées entre la séquence, la structure et le mouvement moléculaire. Nous présentons ici VibeGen, un cadre d'IA générative permettant la conception de novo de protéines de bout en bout, conditionnée par les vibrations des modes normaux. VibeGen utilise une architecture duale agentique, comprenant un concepteur de protéines qui génère des candidats de séquences basés sur des modes vibratoires spécifiés, et un prédicteur de protéines qui évalue leur précision dynamique. Cette approche combine diversité, précision et nouveauté durant le processus de conception. Grâce à des simulations moléculaires à l'échelle atomique comme validation directe, nous démontrons que les protéines conçues reproduisent fidèlement les amplitudes des modes normaux prescrits le long du squelette, tout en adoptant diverses structures stables et fonctionnellement pertinentes. Notamment, les séquences générées sont de novo, ne présentant aucune similarité significative avec les protéines naturelles, élargissant ainsi l'espace des protéines accessibles au-delà des contraintes évolutives. Notre travail intègre la dynamique des protéines dans la conception générative de protéines, et établit un lien direct et bidirectionnel entre la séquence et le comportement vibratoire, ouvrant de nouvelles voies pour l'ingénierie de biomolécules aux propriétés dynamiques et fonctionnelles sur mesure. Ce cadre a des implications vastes pour la conception rationnelle d'enzymes flexibles, d'échafaudages dynamiques et de biomatériaux, ouvrant la voie à une ingénierie des protéines pilotée par l'IA et informée par la dynamique.
English
Proteins are dynamic molecular machines whose biological functions, spanning
enzymatic catalysis, signal transduction, and structural adaptation, are
intrinsically linked to their motions. Designing proteins with targeted dynamic
properties, however, remains a challenge due to the complex, degenerate
relationships between sequence, structure, and molecular motion. Here, we
introduce VibeGen, a generative AI framework that enables end-to-end de novo
protein design conditioned on normal mode vibrations. VibeGen employs an
agentic dual-model architecture, comprising a protein designer that generates
sequence candidates based on specified vibrational modes and a protein
predictor that evaluates their dynamic accuracy. This approach synergizes
diversity, accuracy, and novelty during the design process. Via full-atom
molecular simulations as direct validation, we demonstrate that the designed
proteins accurately reproduce the prescribed normal mode amplitudes across the
backbone while adopting various stable, functionally relevant structures.
Notably, generated sequences are de novo, exhibiting no significant similarity
to natural proteins, thereby expanding the accessible protein space beyond
evolutionary constraints. Our work integrates protein dynamics into generative
protein design, and establishes a direct, bidirectional link between sequence
and vibrational behavior, unlocking new pathways for engineering biomolecules
with tailored dynamical and functional properties. This framework holds broad
implications for the rational design of flexible enzymes, dynamic scaffolds,
and biomaterials, paving the way toward dynamics-informed AI-driven protein
engineering.Summary
AI-Generated Summary