ChatPaper.aiChatPaper

Conception de protéines de novo agentique de bout en bout pour des dynamiques sur mesure à l'aide d'un modèle de diffusion linguistique

Agentic End-to-End De Novo Protein Design for Tailored Dynamics Using a Language Diffusion Model

February 14, 2025
Auteurs: Bo Ni, Markus J. Buehler
cs.AI

Résumé

Les protéines sont des machines moléculaires dynamiques dont les fonctions biologiques, englobant la catalyse enzymatique, la transduction de signaux et l'adaptation structurelle, sont intrinsèquement liées à leurs mouvements. Cependant, concevoir des protéines avec des propriétés dynamiques ciblées reste un défi en raison des relations complexes et dégénérées entre la séquence, la structure et le mouvement moléculaire. Nous présentons ici VibeGen, un cadre d'IA générative permettant la conception de novo de protéines de bout en bout, conditionnée par les vibrations des modes normaux. VibeGen utilise une architecture duale agentique, comprenant un concepteur de protéines qui génère des candidats de séquences basés sur des modes vibratoires spécifiés, et un prédicteur de protéines qui évalue leur précision dynamique. Cette approche combine diversité, précision et nouveauté durant le processus de conception. Grâce à des simulations moléculaires à l'échelle atomique comme validation directe, nous démontrons que les protéines conçues reproduisent fidèlement les amplitudes des modes normaux prescrits le long du squelette, tout en adoptant diverses structures stables et fonctionnellement pertinentes. Notamment, les séquences générées sont de novo, ne présentant aucune similarité significative avec les protéines naturelles, élargissant ainsi l'espace des protéines accessibles au-delà des contraintes évolutives. Notre travail intègre la dynamique des protéines dans la conception générative de protéines, et établit un lien direct et bidirectionnel entre la séquence et le comportement vibratoire, ouvrant de nouvelles voies pour l'ingénierie de biomolécules aux propriétés dynamiques et fonctionnelles sur mesure. Ce cadre a des implications vastes pour la conception rationnelle d'enzymes flexibles, d'échafaudages dynamiques et de biomatériaux, ouvrant la voie à une ingénierie des protéines pilotée par l'IA et informée par la dynamique.
English
Proteins are dynamic molecular machines whose biological functions, spanning enzymatic catalysis, signal transduction, and structural adaptation, are intrinsically linked to their motions. Designing proteins with targeted dynamic properties, however, remains a challenge due to the complex, degenerate relationships between sequence, structure, and molecular motion. Here, we introduce VibeGen, a generative AI framework that enables end-to-end de novo protein design conditioned on normal mode vibrations. VibeGen employs an agentic dual-model architecture, comprising a protein designer that generates sequence candidates based on specified vibrational modes and a protein predictor that evaluates their dynamic accuracy. This approach synergizes diversity, accuracy, and novelty during the design process. Via full-atom molecular simulations as direct validation, we demonstrate that the designed proteins accurately reproduce the prescribed normal mode amplitudes across the backbone while adopting various stable, functionally relevant structures. Notably, generated sequences are de novo, exhibiting no significant similarity to natural proteins, thereby expanding the accessible protein space beyond evolutionary constraints. Our work integrates protein dynamics into generative protein design, and establishes a direct, bidirectional link between sequence and vibrational behavior, unlocking new pathways for engineering biomolecules with tailored dynamical and functional properties. This framework holds broad implications for the rational design of flexible enzymes, dynamic scaffolds, and biomaterials, paving the way toward dynamics-informed AI-driven protein engineering.

Summary

AI-Generated Summary

PDF32February 17, 2025