ChatPaper.aiChatPaper

Multi-Objective-gesteuertes diskretes Flow Matching für kontrollierbare biologische Sequenzdesign

Multi-Objective-Guided Discrete Flow Matching for Controllable Biological Sequence Design

May 11, 2025
Autoren: Tong Chen, Yinuo Zhang, Sophia Tang, Pranam Chatterjee
cs.AI

Zusammenfassung

Die Gestaltung biologischer Sequenzen, die mehrere, oft widersprüchliche funktionelle und biophysikalische Kriterien erfüllen, bleibt eine zentrale Herausforderung im Bereich des Biomoleküldesigns. Während diskrete Flow-Matching-Modelle kürzlich vielversprechende Ansätze für effizientes Sampling in hochdimensionalen Sequenzräumen gezeigt haben, adressieren bestehende Methoden nur einzelne Ziele oder erfordern kontinuierliche Einbettungen, die diskrete Verteilungen verzerren können. Wir stellen Multi-Objective-Guided Discrete Flow Matching (MOG-DFM) vor, ein allgemeines Framework, um jeden vortrainierten diskreten Flow-Matching-Generator in Richtung Pareto-effizienter Kompromisse über mehrere skalare Ziele zu steuern. Bei jedem Sampling-Schritt berechnet MOG-DFM einen hybriden Rang-Richtungs-Score für Kandidatenübergänge und wendet einen adaptiven Hyperkegel-Filter an, um konsistenten Fortschritt bei mehreren Zielen zu gewährleisten. Wir haben außerdem zwei unkonditionierte diskrete Flow-Matching-Modelle trainiert, PepDFM für die Erzeugung diverser Peptide und EnhancerDFM für die Generierung funktioneller Enhancer-DNA, als Basismodelle für MOG-DFM. Wir demonstrieren die Wirksamkeit von MOG-DFM bei der Erzeugung von Peptidbindern, die über fünf Eigenschaften optimiert sind (Hämolyse, Anti-Fouling, Löslichkeit, Halbwertszeit und Bindungsaffinität), sowie beim Design von DNA-Sequenzen mit spezifischen Enhancer-Klassen und DNA-Formen. Insgesamt erweist sich MOG-DFM als ein leistungsstarkes Werkzeug für das multi-eigenschaftsgesteuerte Design von Biomolekülsequenzen.
English
Designing biological sequences that satisfy multiple, often conflicting, functional and biophysical criteria remains a central challenge in biomolecule engineering. While discrete flow matching models have recently shown promise for efficient sampling in high-dimensional sequence spaces, existing approaches address only single objectives or require continuous embeddings that can distort discrete distributions. We present Multi-Objective-Guided Discrete Flow Matching (MOG-DFM), a general framework to steer any pretrained discrete-time flow matching generator toward Pareto-efficient trade-offs across multiple scalar objectives. At each sampling step, MOG-DFM computes a hybrid rank-directional score for candidate transitions and applies an adaptive hypercone filter to enforce consistent multi-objective progression. We also trained two unconditional discrete flow matching models, PepDFM for diverse peptide generation and EnhancerDFM for functional enhancer DNA generation, as base generation models for MOG-DFM. We demonstrate MOG-DFM's effectiveness in generating peptide binders optimized across five properties (hemolysis, non-fouling, solubility, half-life, and binding affinity), and in designing DNA sequences with specific enhancer classes and DNA shapes. In total, MOG-DFM proves to be a powerful tool for multi-property-guided biomolecule sequence design.

Summary

AI-Generated Summary

PDF02May 13, 2025