제어 가능한 생물학적 서열 설계를 위한 다목적 지향 이산 흐름 매칭
Multi-Objective-Guided Discrete Flow Matching for Controllable Biological Sequence Design
May 11, 2025
저자: Tong Chen, Yinuo Zhang, Sophia Tang, Pranam Chatterjee
cs.AI
초록
여러 가지 종종 상충하는 기능적 및 생물물리학적 기준을 만족하는 생물학적 서열을 설계하는 것은 생체분자 공학의 핵심 과제로 남아 있습니다. 이산형 플로우 매칭 모델이 최근 고차원 서열 공간에서 효율적인 샘플링을 위해 유망한 결과를 보여주었지만, 기존 접근법은 단일 목표만을 다루거나 이산형 분포를 왜곡할 수 있는 연속형 임베딩을 요구합니다. 우리는 사전 학습된 이산형 시간 플로우 매칭 생성기를 다중 스칼라 목표에 걸쳐 파레토 효율적인 균형으로 이끌기 위한 일반적인 프레임워크인 다중 목표 지향 이산형 플로우 매칭(MOG-DFM)을 제안합니다. 각 샘플링 단계에서 MOG-DFM은 후보 전이에 대해 하이브리드 순위-방향 점수를 계산하고, 일관된 다중 목표 진행을 강제하기 위해 적응형 하이퍼콘 필터를 적용합니다. 또한 우리는 MOG-DFM의 기본 생성 모델로 사용하기 위해 두 가지 무조건 이산형 플로우 매칭 모델, 즉 다양한 펩타이드 생성을 위한 PepDFM과 기능적 인핸서 DNA 생성을 위한 EnhancerDFM을 학습시켰습니다. 우리는 MOG-DFM이 5가지 특성(용혈성, 비-오염성, 용해도, 반감기, 결합 친화도)에 걸쳐 최적화된 펩타이드 결합체를 생성하고, 특정 인핸서 클래스와 DNA 형태를 가진 DNA 서열을 설계하는 데 있어서의 효과성을 입증합니다. 전반적으로, MOG-DFM은 다중 특성 지향 생체분자 서열 설계를 위한 강력한 도구임을 보여줍니다.
English
Designing biological sequences that satisfy multiple, often conflicting,
functional and biophysical criteria remains a central challenge in biomolecule
engineering. While discrete flow matching models have recently shown promise
for efficient sampling in high-dimensional sequence spaces, existing approaches
address only single objectives or require continuous embeddings that can
distort discrete distributions. We present Multi-Objective-Guided Discrete Flow
Matching (MOG-DFM), a general framework to steer any pretrained discrete-time
flow matching generator toward Pareto-efficient trade-offs across multiple
scalar objectives. At each sampling step, MOG-DFM computes a hybrid
rank-directional score for candidate transitions and applies an adaptive
hypercone filter to enforce consistent multi-objective progression. We also
trained two unconditional discrete flow matching models, PepDFM for diverse
peptide generation and EnhancerDFM for functional enhancer DNA generation, as
base generation models for MOG-DFM. We demonstrate MOG-DFM's effectiveness in
generating peptide binders optimized across five properties (hemolysis,
non-fouling, solubility, half-life, and binding affinity), and in designing DNA
sequences with specific enhancer classes and DNA shapes. In total, MOG-DFM
proves to be a powerful tool for multi-property-guided biomolecule sequence
design.Summary
AI-Generated Summary