ChatPaper.aiChatPaper

Multi-Doelstelling-Gestuurde Discrete Stroomafstemming voor Beheerbare Biologische Sequentieontwerp

Multi-Objective-Guided Discrete Flow Matching for Controllable Biological Sequence Design

May 11, 2025
Auteurs: Tong Chen, Yinuo Zhang, Sophia Tang, Pranam Chatterjee
cs.AI

Samenvatting

Het ontwerpen van biologische sequenties die voldoen aan meerdere, vaak tegenstrijdige, functionele en biofysische criteria blijft een centrale uitdaging in biomoleculaire engineering. Hoewel discrete flow matching-modellen recentelijk veelbelovend zijn gebleken voor efficiënte steekproefname in hoogdimensionale sequentieruimten, richten bestaande benaderingen zich slechts op enkele doelstellingen of vereisen ze continue inbeddingen die discrete verdelingen kunnen verstoren. Wij presenteren Multi-Objective-Guided Discrete Flow Matching (MOG-DFM), een algemeen raamwerk om elke vooraf getrainde discrete-time flow matching-generator te sturen naar Pareto-efficiënte afwegingen over meerdere scalaire doelstellingen. Bij elke steekproefstap berekent MOG-DFM een hybride rangrichtingsscore voor kandidaatovergangen en past een adaptief hyperconefilter toe om consistente multi-objectieve voortgang af te dwingen. We hebben ook twee onvoorwaardelijke discrete flow matching-modellen getraind, PepDFM voor diverse peptidegeneratie en EnhancerDFM voor functionele enhancer DNA-generatie, als basisgeneratiemodellen voor MOG-DFM. We demonstreren de effectiviteit van MOG-DFM bij het genereren van peptidebinders die zijn geoptimaliseerd over vijf eigenschappen (hemolyse, niet-vervuiling, oplosbaarheid, halfwaardetijd en bindingsaffiniteit), en bij het ontwerpen van DNA-sequenties met specifieke enhancerklassen en DNA-vormen. In het algemeen blijkt MOG-DFM een krachtig hulpmiddel te zijn voor multi-eigenschap-gestuurde biomoleculaire sequentieontwerp.
English
Designing biological sequences that satisfy multiple, often conflicting, functional and biophysical criteria remains a central challenge in biomolecule engineering. While discrete flow matching models have recently shown promise for efficient sampling in high-dimensional sequence spaces, existing approaches address only single objectives or require continuous embeddings that can distort discrete distributions. We present Multi-Objective-Guided Discrete Flow Matching (MOG-DFM), a general framework to steer any pretrained discrete-time flow matching generator toward Pareto-efficient trade-offs across multiple scalar objectives. At each sampling step, MOG-DFM computes a hybrid rank-directional score for candidate transitions and applies an adaptive hypercone filter to enforce consistent multi-objective progression. We also trained two unconditional discrete flow matching models, PepDFM for diverse peptide generation and EnhancerDFM for functional enhancer DNA generation, as base generation models for MOG-DFM. We demonstrate MOG-DFM's effectiveness in generating peptide binders optimized across five properties (hemolysis, non-fouling, solubility, half-life, and binding affinity), and in designing DNA sequences with specific enhancer classes and DNA shapes. In total, MOG-DFM proves to be a powerful tool for multi-property-guided biomolecule sequence design.

Summary

AI-Generated Summary

PDF12May 13, 2025