ChatPaper.aiChatPaper

PepTune: Generación De Novo de Péptidos Terapéuticos con Difusión Discreta Guiada por Múltiples Objetivos

PepTune: De Novo Generation of Therapeutic Peptides with Multi-Objective-Guided Discrete Diffusion

December 23, 2024
Autores: Sophia Tang, Yinuo Zhang, Pranam Chatterjee
cs.AI

Resumen

Los péptidos terapéuticos, una importante clase de medicamentos, han logrado un éxito notable en enfermedades como la diabetes y el cáncer, con ejemplos destacados como los agonistas del receptor GLP-1 que han revolucionado el tratamiento de la diabetes tipo 2 y la obesidad. A pesar de su éxito, el diseño de péptidos que cumplan múltiples objetivos conflictivos, como la afinidad de unión al objetivo, la solubilidad y la permeabilidad de membrana, sigue siendo un desafío importante. El desarrollo de fármacos clásico y el diseño basado en la estructura son ineficaces para estas tareas, ya que no logran optimizar propiedades funcionales globales críticas para la eficacia terapéutica. Los marcos generativos existentes están en gran medida limitados a espacios continuos, salidas no condicionadas o guía de un solo objetivo, lo que los hace inadecuados para la optimización de secuencias discretas en múltiples propiedades. Para abordar esto, presentamos PepTune, un modelo de difusión discreta multiobjetivo para la generación y optimización simultánea de SMILES de péptidos terapéuticos. Basado en el marco del Modelo de Lenguaje Discreto Enmascarado (MDLM), PepTune garantiza estructuras de péptidos válidas con programaciones de enmascaramiento dependientes del estado y objetivos basados en penalizaciones. Para guiar el proceso de difusión, proponemos una estrategia basada en Búsqueda de Árbol de Monte Carlo (MCTS) que equilibra la exploración y la explotación para refinar de forma iterativa secuencias óptimas de Pareto. MCTS integra recompensas basadas en clasificadores con la expansión del árbol de búsqueda, superando los desafíos de estimación de gradiente y la escasez de datos inherentes a los espacios discretos. Utilizando PepTune, generamos péptidos diversificados y químicamente modificados optimizados para múltiples propiedades terapéuticas, incluida la afinidad de unión al objetivo, permeabilidad de membrana, solubilidad, hemólisis y características no adhesivas en varios objetivos relevantes para enfermedades. En total, nuestros resultados demuestran que la difusión discreta guiada por MCTS es un enfoque potente y modular para el diseño de secuencias multiobjetivo en espacios de estados discretos.
English
Peptide therapeutics, a major class of medicines, have achieved remarkable success across diseases such as diabetes and cancer, with landmark examples such as GLP-1 receptor agonists revolutionizing the treatment of type-2 diabetes and obesity. Despite their success, designing peptides that satisfy multiple conflicting objectives, such as target binding affinity, solubility, and membrane permeability, remains a major challenge. Classical drug development and structure-based design are ineffective for such tasks, as they fail to optimize global functional properties critical for therapeutic efficacy. Existing generative frameworks are largely limited to continuous spaces, unconditioned outputs, or single-objective guidance, making them unsuitable for discrete sequence optimization across multiple properties. To address this, we present PepTune, a multi-objective discrete diffusion model for the simultaneous generation and optimization of therapeutic peptide SMILES. Built on the Masked Discrete Language Model (MDLM) framework, PepTune ensures valid peptide structures with state-dependent masking schedules and penalty-based objectives. To guide the diffusion process, we propose a Monte Carlo Tree Search (MCTS)-based strategy that balances exploration and exploitation to iteratively refine Pareto-optimal sequences. MCTS integrates classifier-based rewards with search-tree expansion, overcoming gradient estimation challenges and data sparsity inherent to discrete spaces. Using PepTune, we generate diverse, chemically-modified peptides optimized for multiple therapeutic properties, including target binding affinity, membrane permeability, solubility, hemolysis, and non-fouling characteristics on various disease-relevant targets. In total, our results demonstrate that MCTS-guided discrete diffusion is a powerful and modular approach for multi-objective sequence design in discrete state spaces.

Summary

AI-Generated Summary

PDF52December 26, 2024