Progettazione End-to-End Agente di Proteine De Novo con Dinamiche Personalizzate Utilizzando un Modello di Diffusione Linguistica
Agentic End-to-End De Novo Protein Design for Tailored Dynamics Using a Language Diffusion Model
February 14, 2025
Autori: Bo Ni, Markus J. Buehler
cs.AI
Abstract
Le proteine sono macchine molecolari dinamiche le cui funzioni biologiche, che spaziano dalla catalisi enzimatica alla trasduzione del segnale e all'adattamento strutturale, sono intrinsecamente legate ai loro movimenti. Progettare proteine con proprietà dinamiche mirate rimane tuttavia una sfida a causa delle complesse e degenerate relazioni tra sequenza, struttura e movimento molecolare. Qui presentiamo VibeGen, un framework di intelligenza artificiale generativa che consente la progettazione di proteine de novo end-to-end condizionata alle vibrazioni dei modi normali. VibeGen utilizza un'architettura duale agentica, composta da un progettista di proteine che genera candidati di sequenza basati su specifici modi vibrazionali e un predittore di proteine che ne valuta l'accuratezza dinamica. Questo approccio sinergizza diversità, accuratezza e novità durante il processo di progettazione. Attraverso simulazioni molecolari full-atom come validazione diretta, dimostriamo che le proteine progettate riproducono accuratamente le ampiezze dei modi normali prescritte lungo lo scheletro, adottando al contempo varie strutture stabili e funzionalmente rilevanti. È importante notare che le sequenze generate sono de novo, non mostrando alcuna significativa somiglianza con proteine naturali, espandendo così lo spazio proteico accessibile oltre i vincoli evolutivi. Il nostro lavoro integra la dinamica proteica nella progettazione generativa di proteine e stabilisce un collegamento diretto e bidirezionale tra sequenza e comportamento vibrazionale, aprendo nuove vie per l'ingegnerizzazione di biomolecole con proprietà dinamiche e funzionali su misura. Questo framework ha ampie implicazioni per la progettazione razionale di enzimi flessibili, scaffold dinamici e biomateriali, tracciando la strada verso un'ingegneria proteica guidata dall'IA e informata dalla dinamica.
English
Proteins are dynamic molecular machines whose biological functions, spanning
enzymatic catalysis, signal transduction, and structural adaptation, are
intrinsically linked to their motions. Designing proteins with targeted dynamic
properties, however, remains a challenge due to the complex, degenerate
relationships between sequence, structure, and molecular motion. Here, we
introduce VibeGen, a generative AI framework that enables end-to-end de novo
protein design conditioned on normal mode vibrations. VibeGen employs an
agentic dual-model architecture, comprising a protein designer that generates
sequence candidates based on specified vibrational modes and a protein
predictor that evaluates their dynamic accuracy. This approach synergizes
diversity, accuracy, and novelty during the design process. Via full-atom
molecular simulations as direct validation, we demonstrate that the designed
proteins accurately reproduce the prescribed normal mode amplitudes across the
backbone while adopting various stable, functionally relevant structures.
Notably, generated sequences are de novo, exhibiting no significant similarity
to natural proteins, thereby expanding the accessible protein space beyond
evolutionary constraints. Our work integrates protein dynamics into generative
protein design, and establishes a direct, bidirectional link between sequence
and vibrational behavior, unlocking new pathways for engineering biomolecules
with tailored dynamical and functional properties. This framework holds broad
implications for the rational design of flexible enzymes, dynamic scaffolds,
and biomaterials, paving the way toward dynamics-informed AI-driven protein
engineering.Summary
AI-Generated Summary