ChatPaper.aiChatPaper

Lernen, regulatorische Elemente für die Vorhersage der Genexpression zu entdecken

Learning to Discover Regulatory Elements for Gene Expression Prediction

February 19, 2025
Autoren: Xingyu Su, Haiyang Yu, Degui Zhi, Shuiwang Ji
cs.AI

Zusammenfassung

Wir betrachten das Problem der Vorhersage von Genexpressionen aus DNA-Sequenzen. Eine zentrale Herausforderung dieser Aufgabe besteht darin, die regulatorischen Elemente zu identifizieren, die die Genexpression steuern. Hier stellen wir Seq2Exp vor, ein Sequence-to-Expression-Netzwerk, das explizit dazu entwickelt wurde, regulatorische Elemente zu entdecken und zu extrahieren, die die Zielgenexpression antreiben, wodurch die Genauigkeit der Genexpressionsvorhersage verbessert wird. Unser Ansatz erfasst die kausale Beziehung zwischen epigenomischen Signalen, DNA-Sequenzen und ihren assoziierten regulatorischen Elementen. Insbesondere schlagen wir vor, die epigenomischen Signale und die DNA-Sequenz unter Berücksichtigung der kausal aktiven regulatorischen Elemente zu zerlegen und einen Informationsengpass mit der Beta-Verteilung anzuwenden, um ihre Effekte zu kombinieren, während nicht-kausale Komponenten herausgefiltert werden. Unsere Experimente zeigen, dass Seq2Exp bestehende Baseline-Methoden in Genexpressionsvorhersageaufgaben übertrifft und einflussreiche Regionen im Vergleich zu häufig verwendeten statistischen Methoden zur Peak-Erkennung wie MACS3 entdeckt. Der Quellcode wurde als Teil der AIRS-Bibliothek veröffentlicht (https://github.com/divelab/AIRS/).
English
We consider the problem of predicting gene expressions from DNA sequences. A key challenge of this task is to find the regulatory elements that control gene expressions. Here, we introduce Seq2Exp, a Sequence to Expression network explicitly designed to discover and extract regulatory elements that drive target gene expression, enhancing the accuracy of the gene expression prediction. Our approach captures the causal relationship between epigenomic signals, DNA sequences and their associated regulatory elements. Specifically, we propose to decompose the epigenomic signals and the DNA sequence conditioned on the causal active regulatory elements, and apply an information bottleneck with the Beta distribution to combine their effects while filtering out non-causal components. Our experiments demonstrate that Seq2Exp outperforms existing baselines in gene expression prediction tasks and discovers influential regions compared to commonly used statistical methods for peak detection such as MACS3. The source code is released as part of the AIRS library (https://github.com/divelab/AIRS/).

Summary

AI-Generated Summary

PDF22February 24, 2025