PepTune: Generación De Novo de Péptidos Terapéuticos con Difusión Discreta Guiada por Múltiples Objetivos
PepTune: De Novo Generation of Therapeutic Peptides with Multi-Objective-Guided Discrete Diffusion
December 23, 2024
Autores: Sophia Tang, Yinuo Zhang, Pranam Chatterjee
cs.AI
Resumen
Los péptidos terapéuticos, una importante clase de medicamentos, han logrado un éxito notable en enfermedades como la diabetes y el cáncer, con ejemplos destacados como los agonistas del receptor GLP-1 que han revolucionado el tratamiento de la diabetes tipo 2 y la obesidad. A pesar de su éxito, el diseño de péptidos que cumplan múltiples objetivos conflictivos, como la afinidad de unión al objetivo, la solubilidad y la permeabilidad de membrana, sigue siendo un desafío importante. El desarrollo de fármacos clásico y el diseño basado en la estructura son ineficaces para estas tareas, ya que no logran optimizar propiedades funcionales globales críticas para la eficacia terapéutica. Los marcos generativos existentes están en gran medida limitados a espacios continuos, salidas no condicionadas o guía de un solo objetivo, lo que los hace inadecuados para la optimización de secuencias discretas en múltiples propiedades. Para abordar esto, presentamos PepTune, un modelo de difusión discreta multiobjetivo para la generación y optimización simultánea de SMILES de péptidos terapéuticos. Basado en el marco del Modelo de Lenguaje Discreto Enmascarado (MDLM), PepTune garantiza estructuras de péptidos válidas con programaciones de enmascaramiento dependientes del estado y objetivos basados en penalizaciones. Para guiar el proceso de difusión, proponemos una estrategia basada en Búsqueda de Árbol de Monte Carlo (MCTS) que equilibra la exploración y la explotación para refinar de forma iterativa secuencias óptimas de Pareto. MCTS integra recompensas basadas en clasificadores con la expansión del árbol de búsqueda, superando los desafíos de estimación de gradiente y la escasez de datos inherentes a los espacios discretos. Utilizando PepTune, generamos péptidos diversificados y químicamente modificados optimizados para múltiples propiedades terapéuticas, incluida la afinidad de unión al objetivo, permeabilidad de membrana, solubilidad, hemólisis y características no adhesivas en varios objetivos relevantes para enfermedades. En total, nuestros resultados demuestran que la difusión discreta guiada por MCTS es un enfoque potente y modular para el diseño de secuencias multiobjetivo en espacios de estados discretos.
English
Peptide therapeutics, a major class of medicines, have achieved remarkable
success across diseases such as diabetes and cancer, with landmark examples
such as GLP-1 receptor agonists revolutionizing the treatment of type-2
diabetes and obesity. Despite their success, designing peptides that satisfy
multiple conflicting objectives, such as target binding affinity, solubility,
and membrane permeability, remains a major challenge. Classical drug
development and structure-based design are ineffective for such tasks, as they
fail to optimize global functional properties critical for therapeutic
efficacy. Existing generative frameworks are largely limited to continuous
spaces, unconditioned outputs, or single-objective guidance, making them
unsuitable for discrete sequence optimization across multiple properties. To
address this, we present PepTune, a multi-objective discrete diffusion model
for the simultaneous generation and optimization of therapeutic peptide SMILES.
Built on the Masked Discrete Language Model (MDLM) framework, PepTune ensures
valid peptide structures with state-dependent masking schedules and
penalty-based objectives. To guide the diffusion process, we propose a Monte
Carlo Tree Search (MCTS)-based strategy that balances exploration and
exploitation to iteratively refine Pareto-optimal sequences. MCTS integrates
classifier-based rewards with search-tree expansion, overcoming gradient
estimation challenges and data sparsity inherent to discrete spaces. Using
PepTune, we generate diverse, chemically-modified peptides optimized for
multiple therapeutic properties, including target binding affinity, membrane
permeability, solubility, hemolysis, and non-fouling characteristics on various
disease-relevant targets. In total, our results demonstrate that MCTS-guided
discrete diffusion is a powerful and modular approach for multi-objective
sequence design in discrete state spaces.Summary
AI-Generated Summary