Agentisches End-to-End De Novo Protein-Design für maßgeschneiderte Dynamik unter Verwendung eines Sprachdiffusionsmodells
Agentic End-to-End De Novo Protein Design for Tailored Dynamics Using a Language Diffusion Model
February 14, 2025
Autoren: Bo Ni, Markus J. Buehler
cs.AI
Zusammenfassung
Proteine sind dynamische molekulare Maschinen, deren biologische Funktionen – von enzymatischer Katalyse über Signaltransduktion bis hin zu struktureller Anpassung – eng mit ihren Bewegungen verknüpft sind. Die gezielte Gestaltung von Proteinen mit spezifischen dynamischen Eigenschaften bleibt jedoch eine Herausforderung, da die Beziehungen zwischen Sequenz, Struktur und molekularer Bewegung komplex und degeneriert sind. Hier stellen wir VibeGen vor, ein generatives KI-Framework, das das end-to-end de novo Protein-Design unter Berücksichtigung von Normalmodenschwingungen ermöglicht. VibeGen verwendet eine agentenbasierte Dual-Modell-Architektur, bestehend aus einem Protein-Designer, der Sequenzkandidaten basierend auf spezifizierten Schwingungsmoden generiert, und einem Protein-Prädiktor, der deren dynamische Genauigkeit bewertet. Dieser Ansatz vereint Vielfalt, Genauigkeit und Neuartigkeit während des Designprozesses. Durch vollatomare Molekülsimulationen als direkte Validierung zeigen wir, dass die entworfenen Proteine die vorgegebenen Normalmodenamplituden entlang des Rückgrats präzise reproduzieren, während sie verschiedene stabile, funktionell relevante Strukturen annehmen. Bemerkenswerterweise sind die generierten Sequenzen de novo und weisen keine signifikante Ähnlichkeit zu natürlichen Proteinen auf, wodurch der zugängliche Proteinraum über evolutionäre Beschränkungen hinaus erweitert wird. Unsere Arbeit integriert Proteindynamik in das generative Protein-Design und etabliert eine direkte, bidirektionale Verbindung zwischen Sequenz und Schwingungsverhalten, wodurch neue Wege für die Entwicklung von Biomolekülen mit maßgeschneiderten dynamischen und funktionellen Eigenschaften eröffnet werden. Dieses Framework hat weitreichende Implikationen für das rationale Design flexibler Enzyme, dynamischer Gerüste und Biomaterialien und ebnet den Weg für eine dynamikinformierte, KI-gestützte Protein-Engineering.
English
Proteins are dynamic molecular machines whose biological functions, spanning
enzymatic catalysis, signal transduction, and structural adaptation, are
intrinsically linked to their motions. Designing proteins with targeted dynamic
properties, however, remains a challenge due to the complex, degenerate
relationships between sequence, structure, and molecular motion. Here, we
introduce VibeGen, a generative AI framework that enables end-to-end de novo
protein design conditioned on normal mode vibrations. VibeGen employs an
agentic dual-model architecture, comprising a protein designer that generates
sequence candidates based on specified vibrational modes and a protein
predictor that evaluates their dynamic accuracy. This approach synergizes
diversity, accuracy, and novelty during the design process. Via full-atom
molecular simulations as direct validation, we demonstrate that the designed
proteins accurately reproduce the prescribed normal mode amplitudes across the
backbone while adopting various stable, functionally relevant structures.
Notably, generated sequences are de novo, exhibiting no significant similarity
to natural proteins, thereby expanding the accessible protein space beyond
evolutionary constraints. Our work integrates protein dynamics into generative
protein design, and establishes a direct, bidirectional link between sequence
and vibrational behavior, unlocking new pathways for engineering biomolecules
with tailored dynamical and functional properties. This framework holds broad
implications for the rational design of flexible enzymes, dynamic scaffolds,
and biomaterials, paving the way toward dynamics-informed AI-driven protein
engineering.Summary
AI-Generated Summary