PepTune: Создание терапевтических пептидов де ниво с многокритериально-управляемым дискретным диффузией.
PepTune: De Novo Generation of Therapeutic Peptides with Multi-Objective-Guided Discrete Diffusion
December 23, 2024
Авторы: Sophia Tang, Yinuo Zhang, Pranam Chatterjee
cs.AI
Аннотация
Пептидные препараты, важный класс лекарств, достигли замечательных успехов в лечении заболеваний, таких как диабет и рак, с примерами таких прорывов, как агонисты рецепторов GLP-1, революционизировавшие лечение сахарного диабета 2 типа и ожирения. Несмотря на успех, создание пептидов, удовлетворяющих нескольким противоречащим целям, таким как аффинность связывания с мишенью, растворимость и проницаемость мембраны, остается серьезной проблемой. Классическое развитие лекарств и конструктивное проектирование неэффективны для таких задач, поскольку не способны оптимизировать глобальные функциональные свойства, критические для терапевтической эффективности. Существующие генеративные фреймворки в основном ограничены непрерывными пространствами, неусловными выходами или руководством с одной целью, что делает их непригодными для дискретной оптимизации последовательностей по нескольким свойствам. Для решения этой проблемы мы представляем PepTune, многокритериальную дискретную модель диффузии для одновременного создания и оптимизации терапевтических пептидов SMILES. Основанный на фреймворке Маскированной Дискретной Языковой Модели (MDLM), PepTune обеспечивает допустимые структуры пептидов с расписаниями маскировки, зависящими от состояния, и целями на основе штрафов. Для направления процесса диффузии мы предлагаем стратегию на основе Монте-Карло поиска по дереву (MCTS), которая балансирует исследование и использование для итеративного улучшения Парето-оптимальных последовательностей. MCTS интегрирует классификаторные награды с расширением дерева поиска, преодолевая вызовы оценки градиента и разреженности данных, присущих дискретным пространствам. С использованием PepTune мы создаем разнообразные химически модифицированные пептиды, оптимизированные для нескольких терапевтических свойств, включая аффинность связывания с мишенью, проницаемость мембраны, растворимость, гемолиз и антифулинговые характеристики на различных целях, связанных с заболеваниями. В целом, наши результаты демонстрируют, что MCTS-управляемая дискретная диффузия является мощным и модульным подходом для многокритериального проектирования последовательностей в дискретных пространствах состояний.
English
Peptide therapeutics, a major class of medicines, have achieved remarkable
success across diseases such as diabetes and cancer, with landmark examples
such as GLP-1 receptor agonists revolutionizing the treatment of type-2
diabetes and obesity. Despite their success, designing peptides that satisfy
multiple conflicting objectives, such as target binding affinity, solubility,
and membrane permeability, remains a major challenge. Classical drug
development and structure-based design are ineffective for such tasks, as they
fail to optimize global functional properties critical for therapeutic
efficacy. Existing generative frameworks are largely limited to continuous
spaces, unconditioned outputs, or single-objective guidance, making them
unsuitable for discrete sequence optimization across multiple properties. To
address this, we present PepTune, a multi-objective discrete diffusion model
for the simultaneous generation and optimization of therapeutic peptide SMILES.
Built on the Masked Discrete Language Model (MDLM) framework, PepTune ensures
valid peptide structures with state-dependent masking schedules and
penalty-based objectives. To guide the diffusion process, we propose a Monte
Carlo Tree Search (MCTS)-based strategy that balances exploration and
exploitation to iteratively refine Pareto-optimal sequences. MCTS integrates
classifier-based rewards with search-tree expansion, overcoming gradient
estimation challenges and data sparsity inherent to discrete spaces. Using
PepTune, we generate diverse, chemically-modified peptides optimized for
multiple therapeutic properties, including target binding affinity, membrane
permeability, solubility, hemolysis, and non-fouling characteristics on various
disease-relevant targets. In total, our results demonstrate that MCTS-guided
discrete diffusion is a powerful and modular approach for multi-objective
sequence design in discrete state spaces.Summary
AI-Generated Summary