ChatPaper.aiChatPaper

Correspondência de Fluxo Discreto Orientada por Múltiplos Objetivos para o Design Controlável de Sequências Biológicas

Multi-Objective-Guided Discrete Flow Matching for Controllable Biological Sequence Design

May 11, 2025
Autores: Tong Chen, Yinuo Zhang, Sophia Tang, Pranam Chatterjee
cs.AI

Resumo

Projetar sequências biológicas que atendam a múltiplos critérios funcionais e biofísicos, muitas vezes conflitantes, continua sendo um desafio central na engenharia de biomoléculas. Embora modelos de correspondência de fluxo discreto tenham mostrado recentemente potencial para amostragem eficiente em espaços de sequência de alta dimensionalidade, as abordagens existentes abordam apenas objetivos únicos ou exigem embeddings contínuos que podem distorcer distribuições discretas. Apresentamos o Multi-Objective-Guided Discrete Flow Matching (MOG-DFM), um framework geral para direcionar qualquer gerador de correspondência de fluxo em tempo discreto pré-treinado para trade-offs Pareto-eficientes em múltiplos objetivos escalares. A cada etapa de amostragem, o MOG-DFM calcula uma pontuação híbrida de direção de classificação para transições candidatas e aplica um filtro hipercônico adaptativo para impor uma progressão consistente de múltiplos objetivos. Também treinamos dois modelos de correspondência de fluxo discreto incondicionais, o PepDFM para geração diversificada de peptídeos e o EnhancerDFM para geração de DNA funcional de intensificadores, como modelos base de geração para o MOG-DFM. Demonstramos a eficácia do MOG-DFM na geração de ligantes de peptídeos otimizados em cinco propriedades (hemólise, anti-incrustação, solubilidade, meia-vida e afinidade de ligação), e no design de sequências de DNA com classes específicas de intensificadores e formas de DNA. No total, o MOG-DFM se mostra uma ferramenta poderosa para o design de sequências de biomoléculas guiado por múltiplas propriedades.
English
Designing biological sequences that satisfy multiple, often conflicting, functional and biophysical criteria remains a central challenge in biomolecule engineering. While discrete flow matching models have recently shown promise for efficient sampling in high-dimensional sequence spaces, existing approaches address only single objectives or require continuous embeddings that can distort discrete distributions. We present Multi-Objective-Guided Discrete Flow Matching (MOG-DFM), a general framework to steer any pretrained discrete-time flow matching generator toward Pareto-efficient trade-offs across multiple scalar objectives. At each sampling step, MOG-DFM computes a hybrid rank-directional score for candidate transitions and applies an adaptive hypercone filter to enforce consistent multi-objective progression. We also trained two unconditional discrete flow matching models, PepDFM for diverse peptide generation and EnhancerDFM for functional enhancer DNA generation, as base generation models for MOG-DFM. We demonstrate MOG-DFM's effectiveness in generating peptide binders optimized across five properties (hemolysis, non-fouling, solubility, half-life, and binding affinity), and in designing DNA sequences with specific enhancer classes and DNA shapes. In total, MOG-DFM proves to be a powerful tool for multi-property-guided biomolecule sequence design.
PDF12March 21, 2026