ChatPaper.aiChatPaper

PepTune: Создание терапевтических пептидов де ниво с многокритериально-управляемым дискретным диффузией.

PepTune: De Novo Generation of Therapeutic Peptides with Multi-Objective-Guided Discrete Diffusion

December 23, 2024
Авторы: Sophia Tang, Yinuo Zhang, Pranam Chatterjee
cs.AI

Аннотация

Пептидные препараты, важный класс лекарств, достигли замечательных успехов в лечении заболеваний, таких как диабет и рак, с примерами таких прорывов, как агонисты рецепторов GLP-1, революционизировавшие лечение сахарного диабета 2 типа и ожирения. Несмотря на успех, создание пептидов, удовлетворяющих нескольким противоречащим целям, таким как аффинность связывания с мишенью, растворимость и проницаемость мембраны, остается серьезной проблемой. Классическое развитие лекарств и конструктивное проектирование неэффективны для таких задач, поскольку не способны оптимизировать глобальные функциональные свойства, критические для терапевтической эффективности. Существующие генеративные фреймворки в основном ограничены непрерывными пространствами, неусловными выходами или руководством с одной целью, что делает их непригодными для дискретной оптимизации последовательностей по нескольким свойствам. Для решения этой проблемы мы представляем PepTune, многокритериальную дискретную модель диффузии для одновременного создания и оптимизации терапевтических пептидов SMILES. Основанный на фреймворке Маскированной Дискретной Языковой Модели (MDLM), PepTune обеспечивает допустимые структуры пептидов с расписаниями маскировки, зависящими от состояния, и целями на основе штрафов. Для направления процесса диффузии мы предлагаем стратегию на основе Монте-Карло поиска по дереву (MCTS), которая балансирует исследование и использование для итеративного улучшения Парето-оптимальных последовательностей. MCTS интегрирует классификаторные награды с расширением дерева поиска, преодолевая вызовы оценки градиента и разреженности данных, присущих дискретным пространствам. С использованием PepTune мы создаем разнообразные химически модифицированные пептиды, оптимизированные для нескольких терапевтических свойств, включая аффинность связывания с мишенью, проницаемость мембраны, растворимость, гемолиз и антифулинговые характеристики на различных целях, связанных с заболеваниями. В целом, наши результаты демонстрируют, что MCTS-управляемая дискретная диффузия является мощным и модульным подходом для многокритериального проектирования последовательностей в дискретных пространствах состояний.
English
Peptide therapeutics, a major class of medicines, have achieved remarkable success across diseases such as diabetes and cancer, with landmark examples such as GLP-1 receptor agonists revolutionizing the treatment of type-2 diabetes and obesity. Despite their success, designing peptides that satisfy multiple conflicting objectives, such as target binding affinity, solubility, and membrane permeability, remains a major challenge. Classical drug development and structure-based design are ineffective for such tasks, as they fail to optimize global functional properties critical for therapeutic efficacy. Existing generative frameworks are largely limited to continuous spaces, unconditioned outputs, or single-objective guidance, making them unsuitable for discrete sequence optimization across multiple properties. To address this, we present PepTune, a multi-objective discrete diffusion model for the simultaneous generation and optimization of therapeutic peptide SMILES. Built on the Masked Discrete Language Model (MDLM) framework, PepTune ensures valid peptide structures with state-dependent masking schedules and penalty-based objectives. To guide the diffusion process, we propose a Monte Carlo Tree Search (MCTS)-based strategy that balances exploration and exploitation to iteratively refine Pareto-optimal sequences. MCTS integrates classifier-based rewards with search-tree expansion, overcoming gradient estimation challenges and data sparsity inherent to discrete spaces. Using PepTune, we generate diverse, chemically-modified peptides optimized for multiple therapeutic properties, including target binding affinity, membrane permeability, solubility, hemolysis, and non-fouling characteristics on various disease-relevant targets. In total, our results demonstrate that MCTS-guided discrete diffusion is a powerful and modular approach for multi-objective sequence design in discrete state spaces.

Summary

AI-Generated Summary

PDF52December 26, 2024