ChatPaper.aiChatPaper

PepTune : Génération De Novo de Peptides Thérapeutiques avec une Diffusion Discrète Guidée par Plusieurs Objectifs

PepTune: De Novo Generation of Therapeutic Peptides with Multi-Objective-Guided Discrete Diffusion

December 23, 2024
Auteurs: Sophia Tang, Yinuo Zhang, Pranam Chatterjee
cs.AI

Résumé

Les thérapeutiques peptidiques, une classe majeure de médicaments, ont connu un succès remarquable dans le traitement de maladies telles que le diabète et le cancer, avec des exemples emblématiques tels que les agonistes du récepteur GLP-1 révolutionnant le traitement du diabète de type 2 et de l'obésité. Malgré leur succès, la conception de peptides répondant à des objectifs multiples et conflictuels, tels que l'affinité de liaison à la cible, la solubilité et la perméabilité membranaire, reste un défi majeur. Le développement de médicaments classique et la conception basée sur la structure sont inefficaces pour de telles tâches, car ils ne parviennent pas à optimiser les propriétés fonctionnelles globales critiques pour l'efficacité thérapeutique. Les cadres génératifs existants sont largement limités aux espaces continus, aux sorties non conditionnées ou à un guidage à objectif unique, ce qui les rend inadaptés à l'optimisation de séquences discrètes sur plusieurs propriétés. Pour remédier à cela, nous présentons PepTune, un modèle de diffusion discret multi-objectif pour la génération et l'optimisation simultanées de SMILES de peptides thérapeutiques. Basé sur le cadre du Modèle de Langage Discret Masqué (MDLM), PepTune garantit des structures peptidiques valides avec des calendriers de masquage dépendants de l'état et des objectifs basés sur des pénalités. Pour guider le processus de diffusion, nous proposons une stratégie basée sur la Recherche d'Arbre de Monte Carlo (MCTS) qui équilibre l'exploration et l'exploitation pour affiner de manière itérative les séquences de Pareto-optimal. MCTS intègre des récompenses basées sur des classificateurs avec l'expansion de l'arbre de recherche, surmontant ainsi les défis d'estimation du gradient et la rareté des données inhérents aux espaces discrets. En utilisant PepTune, nous générons des peptides diversifiés et chimiquement modifiés optimisés pour de multiples propriétés thérapeutiques, notamment l'affinité de liaison à la cible, la perméabilité membranaire, la solubilité, l'hémolyse et les caractéristiques de non-fouling sur diverses cibles pertinentes pour les maladies. Dans l'ensemble, nos résultats démontrent que la diffusion discrète guidée par MCTS est une approche puissante et modulaire pour la conception de séquences multi-objectifs dans des espaces d'états discrets.
English
Peptide therapeutics, a major class of medicines, have achieved remarkable success across diseases such as diabetes and cancer, with landmark examples such as GLP-1 receptor agonists revolutionizing the treatment of type-2 diabetes and obesity. Despite their success, designing peptides that satisfy multiple conflicting objectives, such as target binding affinity, solubility, and membrane permeability, remains a major challenge. Classical drug development and structure-based design are ineffective for such tasks, as they fail to optimize global functional properties critical for therapeutic efficacy. Existing generative frameworks are largely limited to continuous spaces, unconditioned outputs, or single-objective guidance, making them unsuitable for discrete sequence optimization across multiple properties. To address this, we present PepTune, a multi-objective discrete diffusion model for the simultaneous generation and optimization of therapeutic peptide SMILES. Built on the Masked Discrete Language Model (MDLM) framework, PepTune ensures valid peptide structures with state-dependent masking schedules and penalty-based objectives. To guide the diffusion process, we propose a Monte Carlo Tree Search (MCTS)-based strategy that balances exploration and exploitation to iteratively refine Pareto-optimal sequences. MCTS integrates classifier-based rewards with search-tree expansion, overcoming gradient estimation challenges and data sparsity inherent to discrete spaces. Using PepTune, we generate diverse, chemically-modified peptides optimized for multiple therapeutic properties, including target binding affinity, membrane permeability, solubility, hemolysis, and non-fouling characteristics on various disease-relevant targets. In total, our results demonstrate that MCTS-guided discrete diffusion is a powerful and modular approach for multi-objective sequence design in discrete state spaces.

Summary

AI-Generated Summary

PDF52December 26, 2024