多目的誘導型離散フローマッチングによる制御可能な生物学的配列設計
Multi-Objective-Guided Discrete Flow Matching for Controllable Biological Sequence Design
May 11, 2025
著者: Tong Chen, Yinuo Zhang, Sophia Tang, Pranam Chatterjee
cs.AI
要旨
複数の、しばしば相反する機能的・生物物理学的基準を満たす生物学的配列の設計は、生体分子工学における中心的な課題であり続けています。離散フローマッチングモデルは最近、高次元配列空間における効率的なサンプリングにおいて有望視されていますが、既存のアプローチは単一の目的にしか対応していないか、離散分布を歪める可能性のある連続的な埋め込みを必要とします。本論文では、Multi-Objective-Guided Discrete Flow Matching (MOG-DFM)を提案します。これは、任意の事前学習済み離散時間フローマッチング生成器を、複数のスカラー目的関数間のパレート効率的なトレードオフに向けて導くための一般的なフレームワークです。各サンプリングステップにおいて、MOG-DFMは候補遷移に対するハイブリッドランク・方向性スコアを計算し、適応型ハイパーコーンフィルタを適用して一貫した多目的進行を強制します。また、MOG-DFMの基盤生成モデルとして、多様なペプチド生成のためのPepDFMと、機能的なエンハンサーDNA生成のためのEnhancerDFMという2つの無条件離散フローマッチングモデルを学習しました。MOG-DFMの有効性を、5つの特性(溶血性、非汚染性、溶解性、半減期、結合親和性)を最適化したペプチドバインダーの生成、および特定のエンハンサークラスとDNA形状を持つDNA配列の設計において実証します。全体として、MOG-DFMは多特性ガイド型生体分子配列設計の強力なツールであることが証明されました。
English
Designing biological sequences that satisfy multiple, often conflicting,
functional and biophysical criteria remains a central challenge in biomolecule
engineering. While discrete flow matching models have recently shown promise
for efficient sampling in high-dimensional sequence spaces, existing approaches
address only single objectives or require continuous embeddings that can
distort discrete distributions. We present Multi-Objective-Guided Discrete Flow
Matching (MOG-DFM), a general framework to steer any pretrained discrete-time
flow matching generator toward Pareto-efficient trade-offs across multiple
scalar objectives. At each sampling step, MOG-DFM computes a hybrid
rank-directional score for candidate transitions and applies an adaptive
hypercone filter to enforce consistent multi-objective progression. We also
trained two unconditional discrete flow matching models, PepDFM for diverse
peptide generation and EnhancerDFM for functional enhancer DNA generation, as
base generation models for MOG-DFM. We demonstrate MOG-DFM's effectiveness in
generating peptide binders optimized across five properties (hemolysis,
non-fouling, solubility, half-life, and binding affinity), and in designing DNA
sequences with specific enhancer classes and DNA shapes. In total, MOG-DFM
proves to be a powerful tool for multi-property-guided biomolecule sequence
design.Summary
AI-Generated Summary