ChatPaper.aiChatPaper

Многоцелевое управляемое дискретное согласование потоков для контролируемого проектирования биологических последовательностей

Multi-Objective-Guided Discrete Flow Matching for Controllable Biological Sequence Design

May 11, 2025
Авторы: Tong Chen, Yinuo Zhang, Sophia Tang, Pranam Chatterjee
cs.AI

Аннотация

Создание биологических последовательностей, удовлетворяющих множественным, зачастую противоречивым функциональным и биофизическим критериям, остается ключевой задачей в инженерии биомолекул. Хотя модели дискретного согласования потоков (Discrete Flow Matching) недавно продемонстрировали потенциал для эффективной выборки в высокоразмерных пространствах последовательностей, существующие подходы решают лишь отдельные задачи или требуют непрерывных вложений, которые могут искажать дискретные распределения. Мы представляем Multi-Objective-Guided Discrete Flow Matching (MOG-DFM) — универсальную структуру для направления любого предобученного генератора дискретного согласования потоков к Парето-оптимальным компромиссам между несколькими скалярными целями. На каждом шаге выборки MOG-DFM вычисляет гибридный ранг-направленный показатель для кандидатных переходов и применяет адаптивный гиперконусный фильтр для обеспечения согласованного прогресса по множественным целям. Мы также обучили две безусловные модели дискретного согласования потоков: PepDFM для генерации разнообразных пептидов и EnhancerDFM для создания функциональных энхансерных ДНК, которые служат базовыми моделями для MOG-DFM. Мы демонстрируем эффективность MOG-DFM в генерации пептидных связующих, оптимизированных по пяти свойствам (гемолиз, антифоулинг, растворимость, период полураспада и аффинность связывания), а также в проектировании ДНК-последовательностей с определенными классами энхансеров и формами ДНК. В целом, MOG-DFM доказывает свою мощь как инструмент для проектирования последовательностей биомолекул, управляемого множественными свойствами.
English
Designing biological sequences that satisfy multiple, often conflicting, functional and biophysical criteria remains a central challenge in biomolecule engineering. While discrete flow matching models have recently shown promise for efficient sampling in high-dimensional sequence spaces, existing approaches address only single objectives or require continuous embeddings that can distort discrete distributions. We present Multi-Objective-Guided Discrete Flow Matching (MOG-DFM), a general framework to steer any pretrained discrete-time flow matching generator toward Pareto-efficient trade-offs across multiple scalar objectives. At each sampling step, MOG-DFM computes a hybrid rank-directional score for candidate transitions and applies an adaptive hypercone filter to enforce consistent multi-objective progression. We also trained two unconditional discrete flow matching models, PepDFM for diverse peptide generation and EnhancerDFM for functional enhancer DNA generation, as base generation models for MOG-DFM. We demonstrate MOG-DFM's effectiveness in generating peptide binders optimized across five properties (hemolysis, non-fouling, solubility, half-life, and binding affinity), and in designing DNA sequences with specific enhancer classes and DNA shapes. In total, MOG-DFM proves to be a powerful tool for multi-property-guided biomolecule sequence design.

Summary

AI-Generated Summary

PDF01May 13, 2025