PepTune: Die de novo Generierung therapeutischer Peptide mit Mehrziel-gesteuerter diskreter Diffusion
PepTune: De Novo Generation of Therapeutic Peptides with Multi-Objective-Guided Discrete Diffusion
December 23, 2024
Autoren: Sophia Tang, Yinuo Zhang, Pranam Chatterjee
cs.AI
Zusammenfassung
Peptidtherapeutika, eine wichtige Medikamentenklasse, haben bemerkenswerte Erfolge bei Krankheiten wie Diabetes und Krebs erzielt, mit wegweisenden Beispielen wie GLP-1-Rezeptoragonisten, die die Behandlung von Typ-2-Diabetes und Fettleibigkeit revolutioniert haben. Trotz ihres Erfolgs bleibt das Design von Peptiden, die mehrere sich widersprechende Ziele wie die Bindungsaffinität zum Ziel, Löslichkeit und Membranpermeabilität erfüllen, eine große Herausforderung. Klassische Arzneimittelentwicklung und strukturbasiertes Design sind für solche Aufgaben ineffektiv, da sie es versäumen, globale funktionale Eigenschaften zu optimieren, die für die therapeutische Wirksamkeit entscheidend sind. Bestehende generative Rahmenwerke sind weitgehend auf kontinuierliche Räume, unbedingte Ausgaben oder Einzelzielrichtlinien beschränkt, was sie für die diskrete Sequenzoptimierung über mehrere Eigenschaften hinweg ungeeignet macht. Um dies zu bewältigen, stellen wir PepTune vor, ein Multi-Objective Discrete Diffusion Model zur simultanen Generierung und Optimierung von therapeutischen Peptid-SMILES. Aufbauend auf dem Masked Discrete Language Model (MDLM)-Rahmenwerk stellt PepTune gültige Peptidstrukturen mit zustandsabhängigen Maskierungsplänen und strafbewehrten Zielen sicher. Um den Diffusionsprozess zu lenken, schlagen wir eine Monte-Carlo-Tree-Search(MCTS)-basierte Strategie vor, die Exploration und Ausbeutung ausbalanciert, um Pareto-optimale Sequenzen iterativ zu verfeinern. MCTS integriert klassifiziererbasierte Belohnungen mit Suchbaumexpansion, um Gradientenschätzungsprobleme und Datenknappheit, die in diskreten Räumen inhärent sind, zu überwinden. Unter Verwendung von PepTune generieren wir vielfältige, chemisch modifizierte Peptide, die für mehrere therapeutische Eigenschaften optimiert sind, einschließlich der Bindungsaffinität zum Ziel, Membranpermeabilität, Löslichkeit, Hämolyse und nicht-fouling Eigenschaften an verschiedenen krankheitsrelevanten Zielen. Insgesamt zeigen unsere Ergebnisse, dass MCTS-geführte diskrete Diffusion ein leistungsstarker und modularer Ansatz für das Multi-Objective Sequenzdesign in diskreten Zustandsräumen ist.
English
Peptide therapeutics, a major class of medicines, have achieved remarkable
success across diseases such as diabetes and cancer, with landmark examples
such as GLP-1 receptor agonists revolutionizing the treatment of type-2
diabetes and obesity. Despite their success, designing peptides that satisfy
multiple conflicting objectives, such as target binding affinity, solubility,
and membrane permeability, remains a major challenge. Classical drug
development and structure-based design are ineffective for such tasks, as they
fail to optimize global functional properties critical for therapeutic
efficacy. Existing generative frameworks are largely limited to continuous
spaces, unconditioned outputs, or single-objective guidance, making them
unsuitable for discrete sequence optimization across multiple properties. To
address this, we present PepTune, a multi-objective discrete diffusion model
for the simultaneous generation and optimization of therapeutic peptide SMILES.
Built on the Masked Discrete Language Model (MDLM) framework, PepTune ensures
valid peptide structures with state-dependent masking schedules and
penalty-based objectives. To guide the diffusion process, we propose a Monte
Carlo Tree Search (MCTS)-based strategy that balances exploration and
exploitation to iteratively refine Pareto-optimal sequences. MCTS integrates
classifier-based rewards with search-tree expansion, overcoming gradient
estimation challenges and data sparsity inherent to discrete spaces. Using
PepTune, we generate diverse, chemically-modified peptides optimized for
multiple therapeutic properties, including target binding affinity, membrane
permeability, solubility, hemolysis, and non-fouling characteristics on various
disease-relevant targets. In total, our results demonstrate that MCTS-guided
discrete diffusion is a powerful and modular approach for multi-objective
sequence design in discrete state spaces.Summary
AI-Generated Summary